ai智能语音聊天系统 医学影像人工智能启示录(1):起源篇

默认分类1年前 (2024)发布 admin
3,542 0
ChatGPT国内版

第241篇原创

2023

相约第1190天

洞察医疗器械的本质

继”读懂CT”系列后,“拆解”系列意外迎来了第二个专题:读懂AI,继续以专业且有趣的方式,完整梳理医学影像AI。

“拆解”系列是第11期&“读懂AI”系列第一篇,讨论人工智能的昨天与今天。

2023月9月,医工研习社在上海开讲《人工智能在医学影像中的应用:市场、产品与落地》,这不是我们的第一次AI公开课,但却是比较完整的一次,既有对医学影像AI的完整梳理,也有对人工智能产业的分析和思考。

一直以来,专注于大影像、放射治疗、手术机器人、人工智能等领域的我们,虽然对人工智能较为熟悉,但只写了寥寥数篇, 因为无趣。 从应用角度,医学影像AI属于那种“一眼就看明白的东西”:所有的AI都是相同的,所有的AI也都略有不同;所有的AI都在百家争鸣,所有的AI也都在趋于一致。 不过,人工智能的确已经、正在或即将改变各行各业,尤其在医学影像领域大放异彩,因此我们在几乎每一篇文章都提及了AI。 于是,我们准备以AI公开课为核心向外延申,完整呈现“通往医学影像人工智能之路(The Road to in )”系列: 医学影像人工智能启示录(1):起源篇 医学影像人工智能启示录(2):应用篇 医学影像人工智能启示录(3):产业篇 医学影像人工智能启示录(4):算力篇 医学影像人工智能启示录(5):未来篇

这是个注定冷门的系列,因为我们惊讶的发现,虽然AI价值很大,但用户对AI这类工具并不太感冒,或者说对AI接受度有待提高,一方面是AI自身的原因,不过我们更坚定的认为是AI渗透率不够导致的。因此,我们有义务助力让医学影像AI之火再旺一些,让目之所及的读者们都受益。

2022 年 11 月 30 日, 静悄悄推出人工智能对话聊天机器人,短短两个月活跃用户便突破达1亿,成为新一代顶流。

今天,已能扮演医生、翻译员、办公助手、程序员、历史学家、情感分析师、心理咨询师、写作润色师等各种角色,未来还将覆盖更多领域,实现更高级别的人工智能服务。

“扮演”作家(来自网络)

的出现,震惊了全世界,也让所有人都发现今天的人工智能早已不是“人工智障”,其势必会对人类社会产生深远影响。

因此,未来的世界一定是这样的:AI绝不可怕,但不了解AI很可怕。我们所有人都应该了解AI、拥抱AI,让AI更好,我们也会更好,尤其医学影像从业者。

人工智能三起两落

1927年,一张经典合照成了索尔维会议的见证,这是物理学界史上最豪华的全明星阵容。虽然过去近百年,但至今仍没有第二张照片能出其右,我们也惊叹于那个大师辈出的年代。

第五届索尔维会议(彩色为后期技术处理)

其实,在人工智能领域也有类似的“人类群星闪耀时”: 1943年,神经科学家麦卡洛克和数学家皮兹,根据认知心理学中对人类大脑神经功能的研究,提出了今天看来无比简单的M-P模型,这是人类历史上第一个神经网络( ,NN)模型,具有重要里程碑意义,因其从原理上证明了人工神经网络可以计算任何算术和逻辑函数。

第一个神经网络模型(来自网络)

ai智能语音聊天系统 医学影像人工智能启示录(1):起源篇

1950年,“人工智能之父”艾伦·图灵发表了那篇名垂青史的论文《计算机器与智能( and )》,提出了一个关于判断机器是否能够思考的著名试验:图灵测试( test),被后世公认为人工智能研究领域的灵感源泉。 1956年,信息论创始人香农( )、模式识别奠基人塞弗里奇( )、图灵奖和诺贝尔经济学奖得主司马贺( Simon)、麦卡锡(John )等人在达特茅斯学院召开学术会议,讨论一个完全“不食人间烟火”的主题:用机器来模仿人类学习以及其他方面的智能。 达特茅斯会议足足开了两个月,他们各抒己见,一派人企图模拟神经系统,另一派则希望模拟心智,尽管大家没有达成普遍共识,但却为会议讨论的内容起了一个名字:人工智能( ,AI),这便是“人工智能元年”,从此AI开始了历时60多年“三起两落”的发展历程。

人工智能发展历程(来自网络)

第一次兴起

1958年,心理学家弗兰克·罗森布拉特(Frank ),在M-P模型基础上增加Hebb学习规则,建立了”第一台有原创思想能力的机器”:感知机(),第一次把神经网络付诸于工程实现,其成功应用引起了众多学者对神经网络的研究,这便是人工智能的第一次兴起。

第一个感知机工程原型(来自网络)

当时的感知机已拥有如今神经网络的思想和结构,如自动学习权重、梯度下降算法、优化器、损失函数等,为现代人工智能奠定了基础。然而,如此单层神经网络,连简单的异或等线性不可分问题都无法解决,导致神经网络研究“一哄而散”,从此陷入了长达13年的低谷期。 不过,现实就是这么有趣。1974年,保罗·沃尔博斯(Paul John )发明了今天看来影响深远的BP(Back )神经网络,尽管当时并未被重视,但却为人工智能的第二次兴起埋下了火种。

第二次兴起

1986年,沉睡了12年的伟大算法:BP神经网络被唤醒。 心理学家、计算机科学家杰弗里·辛顿( )等人提出了适用于多层感知器的反向传播算法——误差反向传播(Error )算法,为神经网络引入了非线性,改良了单层感知机无法解决异或问题的缺陷。这是神经网络的里程碑式重要算法,从此人工智能迎来了第二次兴起。 因其理论完备严谨,BP算法至今仍广泛应用在很多流行的网络中,但1991年被发现存在梯度消失(梯度爆炸)问题。与此同时,90年代中期诞生的SVM机器学习模型,没有神经网络解释性不强的缺陷,凭借严格的理论推导和完备的数学基础而深受欢迎,导致神经网络研究再次“一哄而散”。从此,“人工智能”这个名词从公众视线就消失了20年。

人工智能60年发展(来自网络)

不过,对人工智能的研究从未停止,而是悄悄分化成计算机视觉(涵盖模式识别、图像处理等)、自然语言理解(涵盖语音识别、对话等)、认知科学(涵盖语音识别、对话等)、机器学习(涵盖各种统计建模、分析工具、计算方法等)、机器人学(涵盖机械、控制、设计、运动规划、任务规划等)等5大领域,各自如火如荼的独立发展。 这期间,人工智能的理论基础从“逻辑推理”转变成“概率统计”,也正是这次转变,使人工智能再统一成为可能,如计算机视觉与自然语言、计算机视觉跟认知、计算机视觉跟机器人均已融合,更重要的是为人工智能的第三次兴起打下了坚实的基础。

第三次兴起

人工智能有今天的繁荣局面,绝离不开“深度学习之父”杰弗里·辛顿的努力。

2012年是计算机视觉史上的一个关键时刻,大规模视觉识别挑战赛()的冠军属于杰弗里·辛顿和他的两个学生——亚历克斯·克里泽夫斯基(Alex )和伊尔亚·苏茨克维(Ilya ),他们设计的取得了颠覆性成果,这是第二个卷积神经网络(CNN),神经网络真正有了“深度”,标志着神经网络的复苏和深度学习(Deep ,DL)的崛起,从此人工智能迎来了第三次兴起。

深度学习是人工智能的子集(来自网络)

与前两次不同的是,这一次人工智能不仅再也不会重回低谷,还会一直蓬勃发展,在计算机视觉、自然语言处理、语音识别等领域大放异彩,因为新算法、大数据、计算力共同促进了深度学习的发展,这是人工智能最好的时代。

深度学习主宰天下

虽然深度学习只是人工智能的一个子集,但毫无疑问,现代人工智能(一定程度)属于深度学习,而这一切都始于卷积神经网络( , CNN)。如果说是第三次人工智能兴起的标志,那么LeNet则是点燃深度学习的火把。

1998年,杨立昆(LeCun)将反向传播算法应用于卷积神经网络,开发出了世界上第一个用于文本数字识别的卷积网络:LeNet-5,堪称卷积神经网络的””,因为定义了卷积神经网络的基本框架:卷积层、池化层、全连接层。

LeNet快速精准识别数字(来自网络)

ai智能语音聊天系统 医学影像人工智能启示录(1):起源篇

随后,LeNet被金融和邮政机构拿来读取信件或支票上的数字与条码,其成功商业化让资本看到了希望,不再满足辨认手写数字,而是更复杂、多样的图像。希望越大失望越大,因为这需要更多、更深的网络,而带来的计算量远远超出当时计算机能力的上限。 与之相比,则生在了更好的时代,因为非线性激活函数ReLU和减少过拟合技术的提出、也因为互联网大数据和数据增强技术,让的成功站在了巨人的肩膀上。当然,更让人们认识到算力的重要性,从此GPU成为了深度学习的宠儿,连曾经的霸道总裁CPU都要靠边站。

成功打响了深度学习的第一枪,这之后新的CNN层出不穷,包括具有广泛影响力的、、等,而者均源自于历届挑战赛。不过,作为计算机视觉领域最权威的比赛于2017年结束了其最后一届,因为2016年已将识别错误率降至2.99%,远超过5.1%的人类视觉平均水平。

深度神经网络发展历程(来自网络)

与此同时,谷歌旗下开发的横空出世,打败了围棋人类冠军,震惊了世界,使深度学习的风头一时无两。2017年甚至被看作深度学习(人工智能)发展最为突飞猛进的一年,不仅在学术界,工业界也取得了重大突破和广泛的应用,尤其是自然语言处理、语音识别和图像处理: 基于深度学习的自然语言处理在文本分类、机器翻译、智能问答、推荐系统以及聊天机器人等方向都有着极为广泛的应用。 基于深度学习的语音技术从实验室走向了市场,得到了谷歌、微软、百度以及科大讯飞等众多科技公司的青睐,应用在语音输入法、家用聊天机器人、医疗语音救助机、智能语音穿戴设备等场景。

基于深度学习的图像处理技术成为了人工智能应用最为成熟的领域,在图像分类、目标检测、图像分割、图像生成、医学影像分析、自动驾驶、机器人视觉、安全监控等领域有着极为出色的表现。

深度学习典型应用场景(来自网络)

2023年突然火爆全网的,更是深度学习推向了新的高度。今天,深度学习已越来越成熟,无论是科研还是应用。尽管大家对深度学习越来越理性,尽管深度学习还有很多问题要解决,尽管还有很多方向需要研究,但我们所有人都知道,深度学习正在主宰一切,注定将深刻地改变我们的生活和工作方式,尤其是所有人都关注的医疗。

智能医疗改变未来

其实,医疗人工智能并不是今天才有的,而是同样也经历了较长的探索期。

1972年,利兹大学研发了AAP Help,用于腹部剧痛的辅助诊断以及手术的相关需求,这是医疗领域最早出现的人工智能系统。在我国同样也由来已久,1978年北京中医医院关幼波教授与计算机专家合作开发了“关幼波肝病诊疗程序”,第1次将医学专家系统应用于传统中医领域。 伴随着第三次人工智能的兴起,工业界纷纷涉足医疗人工智能,让该赛道重新火热。比如,2013年诞生IBM 成为了医疗人工智能的“分水岭”级应用,其能够识别自然语言,在肿瘤治疗方面,能够在几秒之内筛选数十年癌症治疗历史中的150万份患者记录,并为医生提供可供选择的循证治疗方案。 如今,医疗人工智能已在虚拟助手、疾病诊断与预测、医学影像、病历/文献分析、医院管理、智能器械、新药研发、健康管理和基因等9大领域有着极为广泛的应用。

比如,在智能语音识别世界领先的科大讯飞,其开发的“智医助理”(全科辅助医疗),通过了2017年临床执业医师资格考试笔试,在全国53万名考生中属于较高水平。2021年,“智医助理”已在全国20+省市300多个县区常态化应用,日均提供超过40万条辅助诊断建议。

医疗人工智能市场成熟度(来自网络)

在所有医疗应用中,医学影像人工智能的发展无疑是最为成功的。 这是因为,深度学习擅长处理高维度、稀疏的信号,而图像正是非常有代表性的一种。尽管医疗领域中有时序信号处理、临床文本信息提取等重要方向,但都不及图像处理更容易得到结果。

在我国,在政策和技术的双重推动下,人工智能医学影像进入爆发期(2015-2017年),医生对于AI产品的使用热情也空前高涨;因未实质降低工作强度和假阳性等问题,使人工智能医学影像市场回归冷静,不过依然有不少企业持续升级,适应并满足临床,逐步获得市场认可,人工智能医学影像进入平稳发展期(2018-至今)。

医学影像AI的价值(来自网络)

与通用人工智能发展类似,人类对医学影像AI的探索,同样印证了那句“路漫漫其修远兮,吾将上下而求索”。不过,幸运的是,已初见光明,这是医学影像人工智能最好的时代,更重要是我们坚信以后会越来越好,咱们下期见。。。

END

“医工研习社”旨在分享大影像、AI、放疗、机器人、核心部件等领域的相关知识,坚持有理有据的输出。虽以严谨著称,但难免有疏漏,欢迎批评指正;同时也欢迎任何理性的同行交流讨论,谢谢。

读 者 群

感恩终将遇见的你

© 版权声明
广告也精彩

相关文章

暂无评论

暂无评论...