在全球抗击新冠肺炎(Covid-19)疫情方面,各种各样的高新科技都有望“大显身手”,其中最突出的是自然语言处理技术。无论是在抗疫一线,还是在社区管控、疫苗研发等大后方,自然语言处理技术发挥的作用都不可忽视。目前世界上有多个研究团队使用该技术抗击新冠疫情,并取得了可喜的成果。
在新冠疫情中,最早正式发出疫情警告的并不是世界卫生组织或美国疾控中心,而是加拿大一家名为“蓝点”(BlueDot)的健康监测平台;它早在2019年12月31日就向其客户发出了提前疫情警告,避开危险区域。该平台设计了疾病监测分析程序,使用自然语言处理技术来筛选65种语言的新闻报道,以及航空公司数据和动物疾病暴发的报道,在疫情暴发之初发挥了监测功能。
前不久,美国艾伦人工智能研究所发布了“新冠肺炎开放研究数据集”(CORD-19)的资源管理器以及全文本搜索引擎,并表示希望它可以帮助人们探索数据集并确定潜在的研究成果。该机构语言学家道格·雷蒙德博士说:“过去几年,我们在自然语言处理方面取得了长足进步,CORD-19这类数据集的实用性可能会比几年前更大,因为现在我们有了更多可用的工具。”
美国政府曾经宣布联合艾伦人工智能研究所、微软研究院、美国国立卫生研究院等机构共同发布有关新冠疫情的学术文献的开放研究数据集CORD-19,并呼吁世界各地的人工智能专家采取行动,开发新的文本和数据挖掘技术,以帮助科学界回答与新冠疫情相关的高优先级科学问题。其目的是为医学和自然语言处理研究人员发布疫情数据集,以获得有助于对抗此次疫情的真知灼见。
美国哈佛大学医学院的研究人员借助自然语言处理技术最近开发出了一种工具,可以评估新冠患者的病例、社交媒体和健康卫生数据。他们率先努力通过使用机器学习和大数据分析查看来自各种来源的数据和信息来寻找新冠病毒的解决方案。借助自然语言处理工具,他们还可以搜索有关新冠病毒的在线信息,并了解爆发的当前位置。
中国疾病预防控制中心的研究人员最近在使用科技巨头阿里巴巴达摩院的自然语言处理技术开展病历文本分析和流行病学调查工作,并取得了阶段性成果。达摩院的研究团队通过自然语言处理回顾性数据、使用卷积神经网络训练CT影像的识别系统,它可以快速鉴别新冠影像与普通病毒性肺炎影像的区别,最终识别准确率高达 96%。
智能问诊系统能够在线为病患提供问诊服务,其使用应用语义理解、情感分析等自然语言处理技术,通过问题预判、意图反问、分类识别、相似度匹配等方法,不仅能够解答何种情况需要就医,还能实现疫情防控动态进展、科学防护知识、谣言鉴别等问题精准解答,并支持人机协作、自主学习、会话引导等功能。
在疫情防控期间,中国百度灵医智惠推出的“智能咨询助手”,包含新冠问题解答、标准化预问诊路径、在线医生咨询辅助三大模块;它通过自然语言处理技术赋能在线健康咨询平台、政府疫情防控平台、互联网医院等第三方平台,助力其直接为公众提供有关新冠的在线科普、在线咨询,倍数级提升效率。
疫情发生至今,情况愈演愈烈,人们一边要提防新冠肺炎的传染,一边又要不断接受着海量的真假难辨的信息的轰炸。但对于后者,自然语言处理技术能够帮助人们提取信息的主要观点,识别文章情绪甚至分析文章的可信度;这在抗疫信息战中将“谣言”粉碎,促进舆论生态良性循环,从而为抗疫工作提供一份助力。
自然语言处理技术在对抗新冠疫情中发挥了重大作用。虽然自然语言处理技术不是万能神药,但可以帮助研究人员更快地从医疗数据中提取更有用的信息,挖掘其中的规律,从而加快疫苗研发进程,也有助于进行更有效的治疗。自然语言处理技术在本次疫情中的应用证明其在分析医疗和临床数据中大有可为。
由上可知,自然语言处理可以在抗击新冠疫情中大显身手,为打赢这场疫情攻坚战提供了极为有效的技术支撑。有了自然语言处理技术相助,抗疫工作将变得更安全、更高效。正如中国著名学者周海中教授曾经所言:“自然语言处理是极有吸引力的研究领域,它具有重大的理论意义和实用价值。”
文/李言(作者单位:德国人工智能研究中心[DFKI])