发布时间:2015-01-21 10:39 原文链接: 闵应骅:大数据时代聊聊小数据

  现在好像人人都爱说“大数据”,就像平时我去开会,不是用大数据分析这个,就是用大数据建构那个。可是我最近看《美国计算机学会通讯》(CACM)上面提到了几次小数据,我觉得大家也有必要了解一下这个有趣的概念。

  什么是小数据?小数据就是个体化的数据,是我们每个个体的数字化信息。比如我天天都喝一两酒,突然有天喝完酒了胃疼,我就想了,这天和之前有何不同?原来,这天喝的酒是个新牌子,可能就是喝了这个新牌子的酒让我胃疼。这就是我生活中的“小数据”,它不比大数据那样浩瀚繁杂,却对我自己至关重要。

  第一个意识到“小数据”重要性的是美国康奈尔大学教授德波哈尔·艾斯汀。艾斯汀的父亲去年去世了,而早在父亲去世之前几个月,这位计算机科学教授就注意到老人在数字社会脉动中的些许不同——他不再发送电子邮件,不去超级市场买菜,到附近散步的距离也越来越短。

  然而,这种逐渐衰弱的状态,真到医院去检查心电图,却不一定能看出来。到急诊室检查的时候,不管是测脉搏还是查病历,这个90岁的老人都没有表现出特别明显的异常。可事实上,追踪他每时每刻的个体化数据,他的生活其实已经明显与之前不同。这种日常小数据带来的生命讯息的警示和洞察,启发了这位计算机科学教授——小数据可以看作是一种新的医学证据,它是“your row of their data”(他们数据中属于你的那行数据)。

  人们爱说,大数据将改变当代医学,譬如基因组学、蛋白质组学、代谢组学等等,不过由个人数字跟踪驱动的小数据,也将有可能会对个人医疗带来变革,特别是当可穿戴设备更成熟后,移动技术将可以连续、安全、私人地收集并分析你的数据,这可能包括你的工作、购物、睡觉、吃饭、锻炼和通讯,这些数字追踪将得到一幅只属于你的健康自画像。

  拥有了这幅专属于自己的数字自画像,有什么好处呢?假设你是一名患者,这样精确个体化的小数据也许可以帮助你回答:我每次服药应该用怎样的剂量?当然了,药物说明书上会有一个用药指导,但那个数值是基于大量病人海量数据统计分析得来的,但它适不适合此时此刻的你呢?于是,你就需要了解关于你自己的“小数据”。对于慢性病、抑郁症、记忆力衰退和克罗恩病,很需要日常活动变化的数据。大数据一般是从一个大N的种群里面取得的,而小数据n=me。我们需要数据解放,把移动和网络服务的数据解放到你我自己。

  这样一来,小数据也许可以为我们提供更多研究的可能性:能不能通过分析年老父母的集成数据,进而获得他们的健康信息?能不能通过这些集成数据,比较不同的医学治疗方案?譬如数据跟踪能说明你散步可以走多远,你多早离开家,那就可以表明关节炎药物治疗效果如何。

  更令人期待的是,小数据或许还将成为人类攻克癌症的一个好帮手。现在许多人认识到需要用患者的数据进行个性化的癌症治疗。我们要特征化所有患者。肿瘤细胞的DNA引起不同的癌症病人非常不同的变化。譬如,大致相同的基因变异或删除只占患者的10%。即使是同一个肿瘤,其细胞的变异也不同。基因之间的相互作用可能引起二次变异,对患者的治疗影响很大。所以,对许多患者用同一个治疗方法是不可能成功的。个性化或者说层次式的药物治疗是要按照特定患者的条件开出药方——不是“对症下药”,而是“对人下药”。这些个性化的治疗都需要记录和分析个人行为随时间变化的规律,这就是小数据。

  当然,这并不是说大数据就不重要。在医学上发现治疗的一般规律需要大数据。欧美各国都在计划编制患者信息的数据库,不但为了癌症治疗,也为开发新的治疗方法。集成大量在线数据库可以推动个性化用药,减轻他们的痛苦。从大数据得到规律,用小数据去匹配个人。

  大数据流行,大家就“言必称大数据”,可这并不是做学问的态度,不要碰到大量的数据,就给它戴上一顶帽子“大数据”。就像20年前,系统工程也很时髦。哪怕是做报告谈到一个比较大的工程,都说那是系统工程。可系统工程又怎么样呢?“那是很难的”,就没有下文了。我们应该敞开思想,研究实际问题,切忌空谈。

相关文章

第七批新职业聚焦三个“新”

22日,记者从人力资源社会保障部举办的新闻发布会上了解到,第七批新职业正式发布,包括17个新职业、42个新工种。人力资源社会保障部职业能力建设司副司长王晓君在发布会上介绍,这次发布的新职业和新工种,反......

我国首款干细胞治疗药品上市!

国家药监局最近通过优先审评审批程序,附条件批准了艾米迈托赛注射液(商品名:艾凯利)上市。这款药物是针对14岁以上因血液系统疾病进行造血干细胞移植后出现的移植物抗宿主病(GVHD)的治疗。作为国内首个获......

2024年云南省大数据产业发展试点示范项目公示

根据《关于组织2024年云南省大数据产业发展试点示范项目申报工作的通知》(设施〔2024〕210号),在企业申报和州市推荐基础上,经部门审核、专家评审等工作程序,现将我省2024年大数据产业发展试点示......

让大脑“同频共振”,致幻剂或助孤独症治疗

科学家已经发现,在社会交往中,互动者的大脑会“同频共振”,产生“同步”的神经元放电活动。不仅是人,小鼠、蝙蝠和猴子等动物在同种个体间互动时,它们的大脑也会“同步”。“这些都说明,互动中的大脑并不是单独......

美科学家:大数据驱动的健康将革新医疗范式

“利用每个人的基因组学图谱和表型组学测量来生成一个独特的‘可操作的可能性’列表。在大多数情况下,这些积极主动的行为,经过临床研究验证,将优化健康,或防止/阻止躯体和大脑从健康向疾病的演变。当疾病演化发......

3年拨开“荆棘丛”,他们把增生的血管“捋直了”

刚收到审稿人长达8页的修改意见时,南京医科大学附属江宁医院呼吸与危重症医学科副教授张允雷有些沮丧。但详细看完修改意见后,他觉得自己和团队遇到了一位非常负责任的审稿人。“由衷地佩服!审稿人几乎逐字逐句地......

武汉专家发现脑胶质母细胞瘤治疗新方案

中新网武汉9月2日电(杨岑)武汉大学人民医院(湖北省人民医院)神经外科研究团队设计并构建一种具有自催化功能及脑肿瘤靶向能力的纳米粒子,在穿透血脑屏障、靶向脑胶质母细胞瘤方面表现出显著能力,并在抑制脑胶......

数智共生开创数字经济新未来——2024中国国际大数据产业博览会观察

8月30日,2024中国国际大数据产业博览会(以下简称“数博会”)在贵阳圆满落幕。从电力人工智能(AI)机器人到高空发电,再到月球大模型,每一年的数博会都有黑科技、新成果惊艳世界,今年也不例外。本届数......

老人患“眼癌”15年眼睑出现肿物不可轻视

眼睑出现肿物,以为是长了“眼疖子”,便自行滴眼药水治疗,不想竟发展成“眼癌”。近日,在四川眼科医院,72岁的李先生经活体病理检查,查出为眼睑基底细胞癌。该病症最大特点是严重时会扩散、转移,导致患者脏器......

湘雅二医院在骨肿瘤及纳米材料领域获新成果

记者8月21日从中南大学湘雅二医院获悉,该医院骨科、肿瘤模型与个体化诊治研究湖南省重点实验室教授黎志宏团队在骨肿瘤、骨转移瘤及纳米材料领域获系列新成果。骨肉瘤是最常见的原发性恶性骨肿瘤。化疗药物耐药是......