然而这些承诺都是虚假且不可靠的,他呼吁更全面的措施来监管基因检测中的个人隐私问题。尽管自己作为联合创始人的公司“人类长寿公司”也涉及基因测序业务,收集大量基因组数据。
他们搜集了 1,061 个样本进行训练,建立起基因信息和面部特征、声音等的关系,并搭建了模型来预测 DNA 背后的三维面部结构、年龄、身高、体重、肤色、瞳孔颜色和声音。
研究人员选取了 10 位来自不同种族的志愿者的图像和基因信息,并打乱,然后让计算机进行配对。结果显示,计算机的配对正确率是 80%。但如果测试对象是来自同一个种族,比如欧洲裔或非洲裔,配对的正确率会有所下降,为 50%。
研究人员表示,目前算法还仅基于千余个样本的训练,随着样本的增加,准确率会得到改善。
美国 DNA 检测公司首席科学家、哥伦比亚大学计算机学助理教授毫不客气地质疑该论文的“主要错误”,认为其实际上并没有利用全基因组信息中的标记物来识别身份,他们只是根据人口统计学上的平均值来进行了预测。
虽然基于算法的推测尚无定论,然而人类基因里包含大量隐私信息却是不争的事实,一旦基因隐私得不到保障,消费者将获得比电话号码泄露更加可怕的后果。