当前位置: 首页 > YYVIP易游技术文档
更新时间:2026-02-01
点击次数:
在新冠肺炎疫情发生后,为实现更好地管控防治效果,人工智能等诸多技术手段正在助力抗击疫情,彰显着高精尖科技的硬实力。在这场全民参与,全科技保卫的防控之战中,谛听医疗致力于为广大消费者提供快速、方便、低成本的体检方法,为医护人员提供新的诊断手段。推出的首个针对新型冠状病毒肺炎的人工智能声纹健康检测系统已经实现商业化应用。
谛听AI声纹检测的技术基础、声纹原理、智能系统、产品优势有哪些?小编对其中的五大知识点进行了整理。
目前人工智能发力的领域主要集中在指纹、脸、声音、眼睛等等,都是人和人之间相互区分的独一无二的标识上,称之为“生物特征”。声音就是这种一种可以反映人身份的生物特征,参考“指纹”的命名方式,可以叫它“声纹”。声纹是指人类语音中携带言语信息的声波频谱,它同指纹一样,具备独特的生物学特征,具有身份识别的作用,不仅具有特定性,而且具有相对的稳定性。
谛听医疗研发人员在实际测试中发现,Covid-19病毒不断变异,感染者声纹特征的变化是从次声慢慢向20Hz 以上的低频声音过渡,对应着病毒感染的部位越来越浅,从肺部到气管到咽喉。由于感染部位浅,病毒的传染性越来越强,无症状感染者的比例不断升高。基于此,推出一项全新的人工智能声纹检测技术。
所谓声纹是用电声学仪器显示的携带言语信息的声波频谱。人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时使用的发声器官--舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异。每个人的语音声学特征既有相对稳定性,又有变异性,不是绝对的、一成不变的。
这种变异可来自生理、病理、心理、模拟、伪装,也与环境干扰有关。尽管如此,由于每个人的发音器官都不尽相同,因此在一般情况下,人们仍能区别不同的人的声音或判断是否是同一人的声音。声纹识别的主要任务包括:语音信号处理、声纹特征提取、声纹建模、声纹比对、判别决策等。
人的正常发声频率在80Hz(男低音)到10000Hz(女高音)范围内;人耳正常的听力频率在20至20000Hz之间。而新冠患者咳嗽时会发出20Hz 以下的超低频音(次声)。
谛听医疗研发团队拥有36年病理学数据与模型的研究,结合人工智能与病理模型的分析体系。在与全球合作的现有新冠样本分析中(包括无症状病人)识别准确率非常高。
——患者一旦感染新冠病毒,最快20分钟之后即可检测出,平均可以检测出的时间为3小时