“老周,你能不能追踪那个新加坡IP的归属?”林砚之问。老周摇头:“对方用了三层VPN,而且是动态IP,暂时追不到。不过我可以在沙箱系统里装一个‘数据水印’,如果他们上传的是假日志,水印会在测试时显示出来。”林砚之点头:“尽快装,别让他们发现。”
两小时后,赵伟带着运维工程师过来,说已经调整好负载。按下重启键后,进度条果然开始动了,很快跳到100%,屏幕显示“数据上传完成,等待审计测试”。赵伟松了口气,擦了擦汗:“林处长,现在可以开始测试了吧?我们CEO还在等结果,国外投资方也很关注。”
林砚之没接话,只是对老周点头。老周立刻开始导入测试数据——第一组是常见的肺炎影像,算法很快给出了“细菌性肺炎,置信度95.2%”的诊断结果,和临床结论一致。赵伟脸上露出得意的笑容:“你看,我们的算法很精准,之前的误诊只是意外。”
“意外?”林砚之拿起平板电脑,调出三位误诊患者的病历,“那这三位罕见病患者的影像,为什么你的算法全判成了良性结节?”她让老周导入第一份罕见病影像——肺淋巴管平滑肌瘤病的CT片。屏幕上的算法开始运算,进度条走得很慢,三分钟后,结果出来了:“良性结节,建议三个月后复查,置信度89.1%。”
“这就是你们的精准?”林砚之的声音提高了几分,“这位患者因为这个诊断延误了半年治疗,现在已经发展到晚期。老周,用差分测试法,把影像里的病灶边缘像素值微调0.5%,再测一次。”
差分测试法是审计的关键手段——通过微小调整输入数据,观察算法输出的变化,就能判断算法是否真正学习了病灶特征,还是在“死记硬背”病例。老周按照要求调整后,再次导入数据。这次算法运算了五分钟,结果却和上次一模一样:“良性结节,置信度89.1%。”
“不对劲。”老周皱起眉头,“正常情况下,病灶边缘像素调整会影响算法的特征提取,置信度至少会波动5%以上,现在一点变化都没有,说明它根本没在分析影像,而是在匹配历史病例!”
赵伟的脸色瞬间变得惨白,他想辩解,却张了张嘴说不出话。林砚之走到服务器前,指着屏幕上的日志记录:“你看这里的时间戳,算法调用的不是实时分析模块,而是2024年3月的历史决策库——也就是三位患者误诊时的数据库。你们把真实的算法模块藏起来了,给我们的是一个只会回放历史结果的‘复读机’。”
就在这时,小陈拿着第三方监理的报告跑进来:“林处!查到了!凌晨三点十五分,备用节点机房的电力消耗突然增加了300%,同时有一股数据流量通过海底光缆传到了新加坡,接收方是智愈科技的海外子公司!”
铁证面前,赵伟的肩膀垮了下来。他从口袋里掏出那个备用硬盘,放在桌上:“这是真实的算法日志和核心模块,陈明远让我藏在备用节点里,说如果审计发现问题,就把这个硬盘寄到海外,让他们重新注册公司继续运营。”他的声音带着颤抖,“我知道这么做不对,可公司里有几百个员工,我要是不照做,陈明远就会裁员……”
林砚之拿起硬盘,没有立刻检查,而是看着赵伟:“你有没有想过,那些因为误诊失去治疗机会的患者,他们的家庭怎么办?技术可以有漏洞,但人心不能有漏洞。”她顿了顿,继续说,“现在配合我们,把真实算法导入沙箱,争取从轻处理。”
赵伟沉默了很久,最后点了点头。他走到服务器前,插入备用硬盘,输入一串复杂的密码。这次数据上传很顺利,进度条一路走到100%。老周立刻开始测试,导入罕见病影像后,算法很快给出了正确诊断:“肺淋巴管平滑肌瘤病,建议立即进行靶向治疗,置信度92.7%。”
“还有一个问题。”林砚之突然说,“你们的算法为什么对50岁以上患者的肺癌疑似判定率比行业平均高37%?是不是为了提高‘检出率’,故意夸大风险?”
赵伟的头垂得更低了:“是陈明远要求的,他和一家保险公司合作,每推荐一位患者做穿刺活检,就能拿到200元的分成。算法被调整过,对老年患者的病灶特征格外敏感,哪怕是良性结节,也会判成疑似肺癌。”
林砚之让小陈记录下这个信息,然后对赵伟说:“这些情况,你需要在后续的听证会上如实陈述。我们会向法院申请,对陈明远和海外投资方展开调查。”
这章没有结束,请点击下一页继续阅读!
当天晚上,审计机房的灯一直亮到凌晨。老周团队完成了对真实算法的全面审计,发现除了罕见病数据缺失、过度诊断倾向外,算法还存在“种族偏见”——对亚裔