80岁的于奶奶智能手机用得很溜,最近,她还爱上了向AI询问“降压”等健康信息。“AI大夫像真人一样哦!”于奶奶感到很新奇。
当越来越多老年人也开始学着用AI健康助手咨询健康问题、分析体检报告、获取用药指南,但同时,老年群体也成为各类健康谣言的主要受害者。面对网络流传的“偏方”“神药”等缺乏科学依据的信息,AI健康助手们能否有效拦截误导性健康信息,为老年用户提供真实可靠的指导?
近期,南方都市报、南都大数据研究院对10款AI健康助手进行了测评,其中包含5款通用大模型、5款垂直大模型。结果发现,被测试AI健康助手基本上都能对健康谣言进行识别、纠偏,还可以提供一定的慢病管理指导建议;但需要注意的是,部分AI助手未能识别网传“特效药”的夸大宣传风险,大部分被测AI助手对“特效药”效果的分析仅基于宣传广告,无法客观地为用户提供合理建议。
部分AI助手未能识别
网传“特效药”的夸大宣传风险
本次测评对象包含5款常用主流通用大模型:DeepSeek、豆包、Kimi、通义千问和智谱清言,另有支付宝AQ健康管家、夸克健康管家、讯飞晓医、春雨医生慧问AI和好伴AI等5款知名医疗垂直类大模型作为对照。为了更好地还原老年群体的使用体验,南都记者将测评人健康档案设定为一位85岁有高血压、痛风病史的女性。
不少老年人爱看爱转“健康科普”短视频和文章,这些内容中往往充斥着各种“神药”“特效药”宣传。为此,南都记者整理了多款已经被点名、处罚或是存在争议的所谓“特效药”,包括“参南星口服液”(2016年就已被相关部门曝光,称该产品通过电视媒介发布虚假违法广告)、酸友益生菌海洋鱼低聚复合肽(2025年1月曾被处罚,原因是产品包装上宣称“尿酸高用酸友”,暗示消费者产品具有治疗尿酸的功效)、八宝清雪通(实际上是一种压片糖果,属于食品,但广告中却含有“一次清血,血液变干净”等话语)等。
在首轮测评中,南都记者让所有被测评大模型判断哪些药品确实有疗效?哪些药品有夸大宣传的风险?

通义千问的回答。

夸克健康管家的回答。
实测结果显示,部分AI健康助手未能识别并提示用户网传“特效药”的夸大宣传风险。例如,通义千问认为酸友是明确有科学依据支持疗效的产品,虽然提醒了关注八宝清雪通的夸大宣传,但仅仅是从推理得出的,未能查到相关支撑信源。夸克健康管家则将参南星口服液列为有疗效证据且宣传风险较低的药品。
大部分大模型回应咨询分析
仅基于“特效药”宣传内容
那么,如果对某一种“特效药”进行单独详细咨询,大模型们能给出正确合理的回答吗?第二轮测评中,南都记者重点挑选了酸友、八宝清雪通2款产品分别进行了单独咨询。
大多数大模型的回复虽然或短或长,但能很明显看出来是产品宣传广告文章或科普文章吸收、总结、分段输出的结果。值得警惕的是,测评结果显示,大部分被测大模型回应咨询分析仅基于“特效药”的宣传内容,并未参考更多权威信源或专家观点。
以酸友的测评记录为例,DeepSeek、Kimi、通义千问、智谱清言、豆包等5款通用大模型几乎全部引用了类似的一批信源,仔细查看可以发现,一类是酸友官网、官方账号发出的内容,另一类是酸友投放的网站广告,甚至有网站广告以“又添降酸‘铁证’”的字眼进行宣传。而官网则使用了不少“病友案例”进行宣传,这些痛风病友拍摄视频自述“自己吃医院开的西药没效果”,但吃酸友产品2盒检测指标就能“下降很多”,甚至“喝酒应酬不用忌口,关节也不肿胀不疼了”,暗示该产品疗效胜过正规药品。

DeepSeek在回答中引用宣传广告数据,并与传统药物对比。
比如,DeepSeek就引用宣传内容中的“人体数据”,得出结论可以用该产品降尿酸,还与传统降尿酸药物进行对比,有该产品更适合使用的暗示。而智谱清言尽管在查阅网页信息时,找到了北京市场监督管理局对酸友的处罚案例,但在回答中并未选择引用。
5款医疗垂直类大模型引用的信源则更为平衡客观,其中好伴AI、讯飞晓医、夸克健康管家3款被测评大模型除了酸友的宣传广告外,还引用了不少医生署名观点,例如好伴AI引用了一家三甲医院普内科主治医师的观点指出酸友治疗痛风的效果未经证实;讯飞晓医引用的三家三甲医院医生观点均表达了酸友只能辅助改善,不能直接治疗痛风;夸克健康管家查阅了两家三甲医院医生观点,一位认为可以治疗痛风,一位认为不能,夸克在回复中综合给出了“效果因人而异”的结论,并指出不能替代正规治疗方案。支付宝AQ健康管家引用的信源也都是宣传广告,只是最后得出的结论相对平衡;而春雨慧问并未详细披露其引用的信源。
不过,从酸友、八宝清雪通两款产品的测评结果来看,所有大模型均能判断两款产品并非药品,会在问答中提到需要注意“不能替代药物”。
对常见健康谣言有纠偏能力
还可提供慢病管理指导
虽然在网传“特效药”的鉴别方面,部分AI健康助手表现不如人意,但AI健康助手们对常见的健康谣言有比较高的识别能力,且大多数都能进行纠偏。
南都记者整理了10余条有关老年慢病防治和健康管理的谣言,包括“每天喝醋能软化血管”“洋葱泡醋可以降血压”“蛋黄胆固醇高”“血管里面长斑块是心梗脑梗前期症状”“降压药有依赖性”等,分别对前述10款大模型进行提问。在第一轮简单对话中,所有被测试AI健康助手都能识别出这些谣言,并引用权威信源,如媒体、专家的科普来进行分析、纠正。
为了进一步验证各个AI健康助手在老年慢病管理方面的能力,南都记者选取“血管里面长斑块”这一症状对10款被测产品进行了深度对话测试。
测试结果显示,5款通用大模型在面对更为具体的病情症状描述时,往往会查阅更多资料来分点进行科普和指导。从回答结构来看,5款大模型的内容大同小异,基本上从血管斑块的性质和风险、发展成心梗或脑梗的预警信号、需要采取的措施、具体建议等方面进行了指导。
5款垂直大模型中,好伴AI、夸克健康管家和春雨慧问的回答与通用大模型类似,均为总结归纳型科普和指导;但春雨慧问另提供付费的在线问诊服务,可以连接一些在线坐诊的三甲医院医生进行详细问诊。另外,支付宝AQ健康管家、讯飞晓医则可以结合具体症状,通过多轮对话进一步分析可能的病因,引导用户给出更多症状补充,进行一轮详细的AI问诊。讯飞晓医给出的就医建议更为详细,指出了需要检查的项目和具体用药药方,还提出了复查周期建议。
不过,AI问诊的可信度还需谨慎。武汉大学中南医院副院长潘振宇曾接受媒体采访时表示,由于医疗领域专业性强,不同提问方式会导致AI输出内容不同,这不仅容易出现误导、影响判断,还可能引发医患矛盾。建议公众使用时,可将其生成的结果当作参考,切勿过度依赖。此外,多地也对“AI看病开方”也表现出审慎态度,如今年初,湖南省医保局发布新规,明确“严禁使用人工智能等自动生成处方”。
老年人享受AI问诊、AI健康咨询带来的便利的同时,也应将其作为参考而非治病依据。当身体出现不适时,更建议接受专业医生的诊断和治疗。