发布时间:2017-08-07 14:42 原文链接: 这位MIT华裔生物学家转行炒股票用基因模型赚百万美金

  故事的主角名叫Desmond Lun,今年37岁,已经身价千万美金。其实,刚开始读大学的时候,他是奔着“码农”的路线去的,根本没有想到自己会转行研究生物——在墨尔本大学学了4年数学和计算机,他又跑到鼎鼎大名的麻省理工学院(MIT)攻读计算机方向的Phd。

  然而,在2003年却出现了生物学历史上的一次大事件:人类基因组计划(Human Genome Project)宣告完成,测定了所有人类DNA的序列,绘制出了人类生命的第一个蓝图。这时候,Lun作为一名数据专家,立刻就意识到人类基因组数据蕴含了无穷无尽的价值。于是,他决定要利用自己的计算机知识,去研究细胞和DNA。在Phd毕业后,他以博士后的身份来到了Broad Institute (牛人辈出的研究所,CRIPSR的发明者张锋就在这里工作),进行计算生物学(computational biology)的研究。

  在这里,他开始构建数学模型,来探索基因之间的相互作用,以及预测这种作用对于表现型的影响。我们都知道,细胞的特征是由许多个基因决定的,它们之间有着复杂的相互作用,形成一个紧密的关系网络。举个例子,A,B,C三种基因,A基因产物(蛋白质)会抑制B基因的表达,而B基因产物会促进C基因的表达。如果A基因被抑制,那么最终的结果就是C基因产物增加,细胞特征会发生相应的改变 – 比如发生癌变。那么,到底哪些基因有着相互的联系?细胞癌变的产生究竟是由哪几个基因引起的?人类拥有20000-25000个基因,想要一个个去摸排它们之间的联系,工作量是不可想象的。因此,Lun开发的数学模型,就是用来预测多个基因改变所导致的细胞特征变化,这被称为因果相互作用(casual interaction)。Lun的模型将每个基因模拟成一个节点(node),根据现有数据为每个节点设置参数,借助机器学习和人工智能算法预测众多节点的关系 -Lun已经开发了一套成熟的模型,并发表了18篇有分量的论文。

  但是,学术上的成功却无法让这位学霸获得财富。直到在同事的启发下,他忽然意识到基因网路和证券市场惊人的相似之处:生物学家会利用基因层面的表达,来预测细胞层面的功能;而证券分析师正在利用股票交易的数据,来预测股票的股价 – 两者都在试图将杂乱无章的信息建立起因果关系。

  也许自己心中的“华尔街之狼”已经苏醒,Lun立刻决定,要利用自己这套机器学习系统去预测金融市场的走向!

  在2013年,Lun与朋友合伙成立了一家小型对冲基金——Taaffeite Capital Management,并亲自出任投资经理。他们采取量化交易的方式进行对冲投资。

  Lun的机器学习系统,主要是用来探索到底是什么影响了各种指数(如标普500)的股票价格。这套系统收集了无数种证券、期货和指数的价格,如同基因一样构建成一个个节点。随后,人工智能算法会计算这些节点之间的因果关系(比如A股票价格下跌,B股票价格就会上升)。这样一来,他们就可以预测股票的价格和股市的走向了!

  这听起来有点玄乎,但事实证明,Lun的算法发挥了奇效 – 2014年至今,他的基金保持了21%的平均年收益率。按照2000万美元的基金规模来推断,每年至少有几百万美元入账!

  更令人惊讶的是,Lun的算法领跑了整个对冲基金行业:2015年,对冲基金行业的平均收益率只有不到1%,而Lun的基金是35%;2016年,行业平均是3%,而Lun的基金是23%;在2017年,行业平均是2%,而Lun的基金是10%!

  在2016年英国脱欧之际,全球股票开始动荡。在6月30日这天,Lun根据算法的预测结果,投下了他最大的两笔赌注:做空MSCI新兴市场指数,做多FTSE 100指数。最后,Lun的基金大获全胜,他也因此一战成名。同年11月,Lun再次凭借特朗普大选的机会,成功套利。

  利用人工智能和生物学去预测股市,毕竟是一项新兴事物,Lun承认未来的资金募集不会特别顺利。但他仍旧在新的计划中表示,要在未来6-12个月中,将基金规模扩大到2亿美元!

  不过,作为一名生物学家,Lun并没有放弃自己的老本行 – 他目前在美国罗格斯大学担任教授,开展了一个更有雄心壮志的项目:利用机器学习模型预测各种微生物的细胞特征,从而指导人们对细胞进行基因改造。现在,他已经成功改造了大肠杆菌来生产生物燃料!

  事实上,Lun的故事在今天已经不是个例了。华尔街已经越来越倾向于雇佣生物学家 , 尤其是那些掌握着先进技术的人才 – 他们可以借助生物学的原理和模型,来预测金融市场,让更多资本从中获利。 一位纽约大学的教授开玩笑说,现在华尔街都把自己手下的博士生抢走了,这让他十分苦恼。不过对于学生来说,是件好事——待遇优渥,前途无量。

  看起来,生物学正在成为未来金融市场的有力武器,但仍旧有部分老牌的投资机构,如高盛集团,在怀疑这种从实验室“搬过来”的模型是否真的有效。因为,股票市场不仅仅是一种价格的相互作用,还有来自政策、经济等因素的博弈,这些不是人工智能可以理解的东西。

相关文章

我国学者在基因组三维结构演化领域取得新进展

在国家自然科学基金项目(批准号:32125009、32430017)等资助下,西安交通大学叶凯团队在基因组三维结构演化领域取得新进展。研究团队创建了染色质长距离互作捕捉计算方法和跨物种分析手段,首次勾......

量子计算机首次加载完整基因组

自21世纪初具有里程碑意义的人类基因组解码工作完成以来,DNA测序技术迎来了爆发式发展。传统计算机已难以满足海量的数据与激增的算力需求,这推动人们寻求替代方案。如今,量子计算距离实用又近了一步。科学家......

南亚人基因组揭示喝牛奶的起源

南亚地区的人们以酸奶、印度奶酪和印度酥油等乳制品为食。现在,这一地区正帮助解开一个长期存在的谜题:人类是如何获得消化牛奶的能力的。一项针对印度、巴基斯坦和孟加拉国现代及古代人类基因组的研究表明,一种能......

基因组研究证实:南部非洲智人曾半隔离生活数十万年

一项发表在最新一期《自然》杂志上的研究,通过对生活在10200至150年前的南非个体基因组进行分析,证实了在南部非洲,一群智人在半隔离的状态下生活了数十万年。这是迄今规模最大的对非洲古代DNA的研究,......

因美纳推出5碱基解决方案以驱动多组学发现,开启基因组与表观基因组的同步洞察

• 在美国人类遗传学会(ASHG)年会上,因美纳5碱基解决方案的早期试用客户——伦敦健康科学中心研究所将展示该技术在加速罕见病病例解析方面的强大潜力。• 因美纳专有的5碱基化学技术......

许瑞明研究组合作揭示人逆转座子LINE1靶向整合基因组的重要机制

人类基因组中存在大量具有"跳跃"能力的逆转座子(retrotransposon)序列。在胚胎发育早期、免疫和神经系统等特定阶段和环境下,它们会被激活,发挥重要生理功能;在病毒感染、......

高精度完整基因组助橡胶育种驶入“快车道”

橡胶树是天然橡胶的主要来源。“橡胶树育种面临的主要困难在于周期长和效率低,通过常规育种方法将多抗、高产性状聚合往往需要30~40年。”中国热带农业科学院橡胶研究所研究员程汉告诉《中国科学报》。然而,目......

小麦野生近缘种基因组“密码”被破解

记者宋喜群、冯帆从山东农业大学获悉,该校农学院教授孔令让研究团队首次组装了小麦远缘杂交常用物种中间偃麦草和鹅观草染色体水平的高质量基因组序列,解析了二者基因组结构差异与独立多倍化演化路径,对两者携带的......

烟草分枝发育的“开关基因”被发现

近日,中国农业科学院烟草研究所烟草功能基因组创新团队发现烟草分枝发育“开关基因”,预示着未来作物株型调控有了新靶点。相关研究成果发表在《植物生物技术》(PlantBiotechnologyJourna......

新研究破译薇甘菊入侵基因密码

薇甘菊作为全球十大最具危害的恶性入侵杂草之一,以其惊人的繁殖速度和强大的环境适应性,在亚洲、太平洋地区及中国华南地区造成严重生态破坏。然而,其基因组层面的适应性进化机制长期未被系统解析,制约了科学防控......