美国FDA对人工智能辅助药物研发的监管及启示-[广州佳誉医疗器械有限公司]

放射科设备

超声科设备

手术室设备

检验科设备

实验室设备

理疗科设备

急救室设备

儿科设备

眼科设备

牙科设备

妇科男科设备

灭菌消毒设备

医用教学模型

美容仪器设备

家庭保健器具

CR病床推车柜

ABS病床轮椅

医用耗材

新闻中心

美国FDA对人工智能辅助药物研发的监管及启示

Time：2026/5/15 8:31:57 Author：admin

摘要

人工智能的应用能够缩短药物研发周期，降低研发成本，并提高成功率，因此人工智能辅助药物研发愈发普遍。但是人工智能在应用过程中可能面临数据偏见与代表性不足、隐私侵犯、透明度缺失及可解释性不足等问题，可能导致潜在毒性药物进入临床试验，危及受试者生命健康安全。系统梳理美国FDA相关做法可为我国对人工智能辅助药物研发的监管提供有益的借鉴。在对人工智能辅助药物研发的监管中，应当管理数据质量、定期评估模型、吸收公众意见和贯彻以人为本的原则，努力确保在使用人工智能赋能药物研发的同时保护公众健康。

关键词

人工智能；药物研发；监管政策；药物安全

传统药物研发是一个周期长、成本高、风险高的过程。据统计，一个药物研发周期从早期发现到临床上市需要10~15年时间，花费10~20亿美元，且90%的临床药物研发以失败告终。不仅如此，药物研发本身呈现出难度递增的趋势。杰克·斯坎内尔提出的“反摩尔定律”表明，虽然近60年间技术不断进步，但药物研发却逐渐变得更慢、成本更高。相较于传统药物研发而言，人工智能有加快药物研发并降低研发成本的潜力，该作用在药物研发的早期尤为明显。在此阶段，人工智能能够将新药开发成本降低约70%。

人工智能的辅助功能贯穿药物研发的整个过程。具备深度学习能力的人工智能系统能够梳理大量结构化和非结构化数据，对化合物的生物活性进行预测，并生成具有目标特性的新分子结构。计算机模拟试验则有助于分析和确定基因组结构，并准确预测药物与其靶点之间的相互作用。将人工智能引入非临床研究，可将其用于药动学、药效学等研究；在临床研究中可辅助进行受试者招募、依从性监测与数据管理；在上市后阶段，人工智能可用以辅助监测、分析和报告不良事件；在先进制药生产中优化工艺设计，并实现先进过程控制。自2016年以来，人工智能在药物开发和药品审评中的使用，呈指数级增长态势。自2016年到2023年，美国食品药品管理局（FDA）的药品评价与研究中心（CDER）已累计审查逾500份包含人工智能的药品和生物制品申请。

然而，人工智能模型的黑箱特性、高度依赖数据与持续迭代等特点，给传统的药品监管政策带来了前所未有的挑战。美国FDA发布多份指南、意见和讨论文件，以确保在鼓励人工智能辅助药品创新的同时，严守安全性与有效性底线。本文梳理美国FDA对人工智能辅助药物研发的监管措施，以期为我国对人工智能辅助药物研发的监管提供有益的借鉴。

人工智能辅助药物研发存在的风险

1 数据偏见与代表性不足：药物安全风险的重要诱因

人工智能偏见指的是人工智能决策中存在的系统性错误模式，即模型在某些场景下表现准确，但由于训练数据存在偏见或不完整，在其他场景下则会失效。这些偏见往往与特定的数据属性相关，其原因包括训练数据代表性不足、数据收集过程嵌入人类主观偏见、数据标准不统一以及数据互操作性缺失等。例如，很多医疗数据过度集中于所谓“WEIRD”（西方、受教育程度高、工业化、富裕、民主）人群，而少数族裔、女性、老年人或残障人士等弱势群体常被忽视。又如，CRONIN等以日本国立医药品食品卫生研究所第二届Ames/QSAR国际挑战赛的标准化实验结果为基准，分析了其自制模型表现不佳的原因，进而得出结论认为数据代表性不足是模型对化合物致突变性的预测不准确的原因之一。再如，研究人员和临床医生在收集医疗数据时可能受认知偏差影响，在研究中带入无意识的判断和偏见，从而使偏见被固化于数据之中。总之，数据的不准确、不完整或不可追溯性都会引入偏差，降低人工智能模型对人体风险预测的可信度；并且由于现实世界是动态变化的，输入数据的统计特性可能偏离初始训练数据的状态，即产生“数据漂移”现象。

数据偏见与代表性不足诱发的安全风险表现为：若训练数据存在质量、完整性或代表性不足的问题，则算法只能学习多数群体的特征，而无法准确识别少数群体的疾病模式，进而加剧健康不平等。同时，算法对候选药物是有效还是无效，抑或存在潜在毒性的判断可能出现偏差。在算法偏差未能被及时检测与纠正的情况下，这些候选药物将错误地进入后续试验阶段。一旦对其开展人体试验，则有可能引发严重的安全事件，乃至危及受试者生命。

2 知情同意机制缺失：隐私与伦理侵害的核心症结

在医疗研究与临床实践中，患者知情同意与数据保密一直是伦理审查的核心原则。然而，人工智能对数据的需求挑战了这一核心原则。一方面，训练高效、准确的人工智能依赖于大量的临床与生物医学数据，来进行算法训练和模型优化，这些数据通常包含敏感的个人健康信息。若未经患者知情同意径行收集、分析或共享此类信息，或为牟利而滥用数据，将直接侵犯患者的隐私权。另一方面，数据的广泛整合可能导致个人身份被重新识别，进而削弱匿名化与隐私保护的有效性。个人健康数据的使用、传输与储存至关重要。一旦管理不当，极易引发数据泄露。而个人健康数据是重要的个人信息，一旦发生泄露，可能引发歧视和污名化的问题。

在缺乏完善的知情同意机制与严格数据治理体系的当下，人工智能辅助药物研发不仅可能侵犯患者隐私，造成侵权后果，更将弱化医学研究的伦理道德基础，侵蚀公众对医学研究的信任。

3 “黑箱”特性：模型可信度低的根本原因

有别于可解释的、基于传统生物化学原理的药物研发模式，由具备深度学习能力的人工智能所驱动的药物研发，基于多层的神经网络模型，天然地具有显著的“黑箱”特性。这种特性根植于模型的内在结构与原理，神经网络通过层级叠加的隐藏层进行特征提取与抽象，学习输入数据与预期输出之间复杂的、非直观的映射关系。研究者只能清晰地认识模型的输入层和输出层，却难以对中间数量庞大的隐藏层所执行的具体计算以及决策路径加以追踪，也很难对其有直观的理解。“黑箱”特性带来的核心问题在于决策过程的透明度缺失，当神经网络模型做出一个候选药物有效或存在风险的判断时，人们往往无从得知其推理依据。若缺乏及时、有效的监管机制，业界将难以对模型的决策进行充分审查，无法验证逻辑合理性，或识别潜在偏见。透明度的缺失不仅阻碍了及时甄别和有效纠正模型潜在的安全隐患，而且因模型决策错误，可能给患者健康带来重大影响。当人工智能辅助决策出现问题时，可解释性的不足可能导致药物临床实践中责任归属不清、伦理责任错位等问题，降低人们对人工智能的信任度。

人工智能辅助药物研发中存在的安全风险、隐私与伦理问题，以及可解释性和可控性的不足，伴之以信任危机，共同对传统的药品监管政策形成挑战，需要构建适配的新型药品监管制度。

美国FDA对于人工智能辅助药物研发的监管

美国是人工智能产业发展和治理最早的参与者、引领者与规则制定者之一。美国持续推动人工智能技术嵌入各行业，形成商业化应用。通过发布多项与人工智能相关的行政命令（例如2025年1月23日特朗普政府发布的第14179号行政命令《移除美国人工智能领导力障碍》）、政策文件（例如2025年2月6日美国白宫科技政策办公室发布的《关于制定人工智能行动计划的信息征求》），美国维持着其在人工智能产业的优势地位。FDA也高度关注人工智能在药物研发领域适用的潜力，已将人工智能辅助药物研发列为监管的重点领域之一。

美国对于人工智能辅助药物研发的监管，并非以成文法律的形式展开，而是有赖于FDA发布的一系列政策文件加以实现。2023年5月，FDA发布《人工智能与机器学习在药品和生物制品开发中的应用》讨论文件，系统梳理了人工智能和机器学习在药物和生物制品研发全过程中的应用情况与前景，同时探讨了其优势、风险与挑战，并提出了未来与利益相关方开展合作监管的路径。2024年3月，FDA发布《人工智能与医疗产品：生物制品评估与研究中心（CBER）、药物评估与研究中心（CDER）、医疗器械辐射和健康中心（CDRH）和组合产品办公室（OCP）如何协同工作》报告，该报告于2025年2月修正，阐述了人工智能在医疗产品全生命周期中的应用与监管思路，重点包括促进多方合作，制定鼓励创新的监管政策，推动建立相关标准与最佳实践，以及开展人工智能性能评估和监测研究。2025年1月，FDA发布《使用人工智能支持药品和生物制品监管决策的考虑因素：产业及其他利益相关方》指南草案，阐明了药物和生物制品研发中应用人工智能的监管考量因素，提出了一个基于风险的可信度评估框架，用于建立和评估人工智能在特定使用环境下的可信度，并强调尽早与FDA沟通的重要性。

FDA的政策文件强调在药物研发全生命周期强化对人工智能应用的监管。例如，FDA在发布的《人工智能与机器学习在药品和生物制品开发中的应用》讨论稿中，系统阐述了在药物研发全生命周期中，对人工智能与机器学习的可能关注点。又如，FDA在2021年1月发布的《人工智能/机器学习（AI/ML）医疗器械软件行动计划》中，提出了针对人工智能/机器学习的软件（SaMD）的产品全生命周期监管方法，以适应人工智能持续学习和自我优化的特性。该方法强调监管不仅限于上市前审查，还覆盖研发、上市后性能监测与风险管理全过程。FDA对于人工智能医疗器械软件的产品全生命周期监管方法，可以作为对人工智能辅助药物研发加以监管的参照系，并从中管窥FDA在全生命周期中对于人工智能监管的态度。

总体而言，美国FDA对于人工智能辅助药物研发的管理并没有严格的法律法规和刚性规定，而是强调行政监管与行业自律相结合，在积极推动技术创新的同时，逐步加强对人工智能领域的监管力度。以下是FDA重点关注的监管要点。

1 数据质量与隐私监管

人工智能技术有望改变药物研发的全过程。然而，人工智能对用于训练、测试和验证的数据属性或特征尤为敏感，它的成功在很大程度上依赖于高质量的数据。FDA指出，需要重点考虑数据缺失、偏见和数据漂移等因素。因此，FDA计划在数据收集、共享和标准化等环节采取改进的监管措施。FDA指出，应当参考美国国家标准与技术研究院出版的《NIST特别出版物1270——人工智能偏见识别与管理标准研究》，以识别人工智能模型偏见。FDA认为应当确保数据的完整性、可溯源性、相关性、可重复性、可复现性和代表性。完整性要求数据的完整、一致和准确。可溯源性是指能够追溯数据起源的记录链条，包括其在数据库、文档或资料库中的来源，以及数据如何、为何到达当前位置的解释。可重复性是指在回答同一问题的不同研究中，即使每个研究都独立获取了自己的数据，也能够得到一致的结果。可复现性是指在相同的输入数据、计算步骤、方法与代码，以及分析条件下，可以获得一致的结果。代表性是指获取证据的样本与目标群体具有足够相似性的可信度，特别是对少数可能被忽视的群体的代表性，避免模型对某些亚组表现不佳。

FDA重视数据隐私安全。在临床试验中应用人工智能时，必须遵循透明、公平和问责等基本伦理原则。遵守《健康保险携带与责任法案》（HIPAA）、《关于使用真实世界数据（RWD）和真实世界证据（RWE）支持药品和生物制品监管决策的最终指南》等法规对保护患者隐私的规定。个人健康信息的收集、使用、存储和传输等都必须严格遵守相应法规，以减轻法律风险，维系参与者的信任。对于用于训练辅助药物研发的人工智能数据，FDA要求研究者在获取时须获得知情同意，即必须明确说明使用数据的方式，包括是否会用于训练人工智能、数据存储方式、隐私保护措施，以及撤回知情同意的权利等。若受试者对数据使用方式、人工智能模型潜在的偏见等缺乏充分的了解，则无法做出真正意义上的知情同意。FDA要求研究者尽可能使用“去标识化数据”，即移除或转换能够直接或间接识别出特定个人身份的信息，以最大限度地实现数据隐私保护。

2 基于风险的全生命周期监管

在监管训练用的数据之外，FDA也建立了对人工智能模型的监管体系。首先，FDA认为在评估人工智能模型性能时，需重点审查模型的开发和使用场景，包括模型开发是否有清晰的预设步骤，模型评估标准是否有明确书面记录。

其次，FDA认为应关注模型风险，模型风险是确定可信度目标和开展相关活动的首要考量因素。FDA要求定期评估模型性能，确保其在实际应用中的有效性。一方面，要进行偏差检测，即识别和纠正模型可能存在的偏差，确保其在不同人群和环境中的适用性。在对人工智能模型进行安全性和有效性评估时，FDA指出，应当评估人工智能模型在目标使用人群整体以及相关亚组中的表现。如果仅对总人群进行评估，某些亚组中较好的表现可能会掩盖其他亚组中较差的表现。另一方面，已部署的人工智能模型可能利用运行中收集到的数据，来不断扩展其数据集，导致模型的性能会随着时间的推移而发生变化，从而带来风险。因此，持续监控与记录模型运行状态，才是确保其在长期使用中保持可靠性、相关性和一致性的关键措施。

再次，FDA认为还应当对人工智能模型的可信度进行监管。FDA在2025年1月发布的《使用人工智能支持药品和生物制品监管决策的考虑因素：行业及其他利益相关方》指南草案中，提出了一个基于风险的可信度评估框架。框架共分七步，用于评估特定使用场景下人工智能模型决策的可信度。该文件强调应在模型全生命周期内确保可信度，避免模型性能随环境变化而退化，并鼓励研究者在早期与FDA进行沟通，以提升监管的透明度和科学性。

3 由人类主导的治理、透明度与问责制

由人类主导的人工智能治理机制，有助于确保遵循法律与伦理准则。人类主导的治理机制应贯穿药物研发过程中应用人工智能技术的全周期，涵盖规划、开发、应用、修改及停用等环节。对于研发可信赖的药物人工智能研发应用而言，透明度与问责制可谓至关重要。

FDA在2024年6月发布的《机器学习驱动型医疗设备的透明度：指导原则》中指出，“透明度”指的是向相关受众传达机器学习决策系统预期用途、开发过程、性能表现以及可获取的逻辑机制等相关信息的清晰程度。逻辑与可解释性均属于透明度的组成部分。“逻辑”是指关于输出结果、决策或行动形成过程的依据。“可解释性”是指该逻辑能否以人类可理解的方式阐释。实施基于使用场景的风险管理计划有助于指导书面记录、提高可解释性。体现“逻辑”的书面记录能为特定使用场景下人工智能的规划、开发、运行及修改提供关键依据，而可解释性则能为输出结果提供相应证据支撑和逻辑依据。FDA指出，透明度是大规模应用人工智能的核心，因为利益相关者必须能理解进而信任人工智能的输出结果，人工智能才能在药品审评和临床应用中真正发挥作用。在平衡性能与可解释性时，需要重点关注人工智能模型的复杂度。FDA认为，当诸如人工神经网络模型之类的复杂模型，与精简模型的性能相近时，选择更传统、更简洁、参数更少的模型，可能会带来整体优势。

4 监管政策的公众参与

近年来，FDA在人工智能辅助药物研发领域陆续发布了一系列指导性文件，但其中多数仍是草案，这些草案并非有法律约束力的监管规范，而是更多体现了FDA在该领域初步的监管立场与思路。例如，《人工智能与机器学习在药品和生物制品开发中的应用》讨论稿系统性梳理了人工智能/机器学习在药物研发全生命周期中的潜在应用之处并指明了其重点关注的环节，FDA强调，要邀请学界、产业界和公众就治理结构、风险管理、人类介入、透明性及可追溯性等方面提出建议。又如，在2025年1月发布的《使用人工智能支持药品和生物制品监管决策的考虑因素：行业及其他利益相关方》草案指南中，FDA进一步强调公众参与的重要性，提供了正式的反馈渠道，鼓励各方利益相关者通过评论与提交意见的方式，共同推动人工智能在药物开发与监管中的有序应用。该草案的形成整合了专家研讨会和公开研讨会的反馈，并参考了逾800条外部意见。此前处理500余份含人工智能组件的药物申报材料的监管实践经验，也为指南草案的形成提供了关键的依据。

这些指导性文件属于非立法性规则的一种，不创设法律上的权利和义务，不具有法律上的拘束力，但可能对行政机关和公众产生事实上的拘束效果。指导性文件的通告评论程序，表明FDA十分重视公众参与意见反馈，试图通过渐进式的政策试探与意见征集，通过引入实验主义治理，逐步建立适应新兴技术的监管框架。

美国FDA规制逻辑对中国的启示

人工智能在我国药物研发各环节具有广阔前景。在实际应用中，人工智能制药企业英矽智能科技（上海）有限公司自主研发的特发性肺纤维化治疗药物，完成了二期临床试验，为特发性肺纤维化患者带来药物治疗新希望。同时，也有研究者和从业者意识到，人工智能在药物研发应用中仍面临诸多挑战。未来的研究还应更加关注人工智能安全问题，保障人类健康安全。

目前中国政府对于人工智能的监管，包括《网络安全法》、《数据安全法》和《个人信息保护法》中的相关规定，也包括《人工智能生成合成内容标识办法》、《生成式人工智能服务管理暂行办法》、《互联网信息服务深度合成管理规定》等规章和规范性文件中的要求。对于药品领域人工智能的应用，国家药监局于2024年6月发布《药品监管人工智能典型应用场景清单》，阐述了国家药监局对于人工智能在药学领域内应用的立场。工业和信息化部等七部门于2025年3月印发《医药工业数智化转型实施方案（2025—2030年）》，其中包含《医药工业数智化转型典型应用场景》，为医药企业数智化转型工作提供参考。

梳理这些文件可以发现，中国在人工智能辅助药物研发乃至更广泛的药学领域应用方面，尚未出台具体的、可操作的和具有强制约束力的法律规范，相对更侧重于鼓励相关产业的发展。这在一定程度上反映了人工智能作为新兴技术的特点，即技术发展往往先于制度建设，相关政策与监管仍处于探索和观望阶段。随着人工智能在药物研发领域的兴起及风险的逐渐显现，建立健全相应的治理机制已成为当务之急。在此过程中，美国经验可为中国提供有益借鉴，征集公众意见、强调数据治理与伦理考量，以及探索基于风险的人类干预与审计机制等经验，或可作为他山之石，为我国构建符合国情的监管模式提供参考。

1 数据治理

美国FDA认识到数据质量、可靠性和代表性的关键性。在多个指南草案、讨论文件中都涉及到相关的监管措施。我国目前相关做法中，也有提到需要强化标准引领，加快推进通用标准和方法标准。数据对于人工智能影响并不区分国界，可以借鉴美国FDA的相关做法，在我国构建统一的数据框架，出台相应数据标准指南，提高数据质量。一方面，要求开发者在训练辅助药物研发的人工智能平台时，应当设定专门检查程序，确保数据的相关性、可靠性和代表性，防止出现系统性的歧视。另一方面，保护数据隐私，收集数据前应当充分告知并取得知情同意，在使用数据时推广“数据最小必要”和“去标识化”原则，最大限度保护个人隐私。

2 模型治理

美国FDA的监管措施表明，人工智能模型的审查并非一劳永逸的静态过程。相反，人工智能在投入使用后仍需接受持续性的监管与评估，以确保其长期的安全性、有效性与合规性。这意味着监管不仅应当涵盖模型的开发与审批阶段，还需延伸至实际应用的全生命周期。我国药品监管部门可以建立起贯穿模型全生命周期的监管体系。例如，建立预先设定的控制变更计划，对模型可能经历的更新、优化和再训练过程进行规范管理，并将预先设定的控制变更计划纳入药械审批要求。又如，设立周期性评估节点，通过定期评估来检测模型性能是否出现偏差或新的潜在风险，从而及时采取干预措施。通过这一动态监管机制，保证人工智能技术在药物研发领域的可靠性与可持续应用。

3 增加公众参与

有必要让科技企业与初创团队参与人工智能监管政策的形成。科技企业与初创团队投入巨额研发资金，拥有全球最顶尖的工程师和研究资源，从算法创新到硬件部署，都能在行业内率先实现突破。例如，谷歌deepmind开发的AlphaFold赢得了2020年的蛋白质结构预测领域的权威赛事CASP（结构预测关键评估），其表现超越了上百个人类科学家团队。可以说，企业往往处于研究与应用的最前沿，监管部门在制定和完善人工智能治理政策时，应当充分听取企业的意见。我国可探索建立相应的机制，如建立多元的常设专家委员会，定期举办研讨会与业界沟通，广泛听取多方意见并在将这些反馈纳入政策考量。

4 强化“以人为本”原则

FDA在其监管中重视人类主导的治理机制，透明度和问责制，以规避潜在风险。在人工智能辅助药物研发中，我国可以考虑确立“以人为本”的核心原则，确保关键决策和风险控制环节始终由具备专业判断的人类专家把关，确保人工智能的输出结果符合伦理道德要求。具体而言，可以在模型开发各阶段规定必须有人类复核的环节，同时强制记录每次“人机协同”决策的审计日志，包括审核人、时间、审核意见及任何对模型结果的人工改动；日志须采用如区块链或数字签名等不可篡改的技术存储，以建立完备的问责与审计机制；模型的算法结构、参数设置、特征选择方法等关键细节必须披露，以提高模型的透明度，从而更好保护公众福祉。

本文由广州佳誉医疗器械有限公司/佛山浩扬医疗器械有限公司联合编辑

上一篇：重庆：以数智工具重塑医疗器械核查模式
下一篇： FDA发布减肥医疗器械定稿指南