今年是新修訂的《醫療器械監督管理條例》施行的第一年,企業的質量主體責任更加突出,產品的驗證與確認活動趨于多元化,對標準規范的需求更加強烈。在人工智能醫療器械監管研究方面,國家藥監局取得了豐碩的成果,圍繞產品的分類界定、審評審批等發布了多個指導原則的征求意見稿。在國家政策與監管科學的支持下,國內獲批上市的產品數量持續增加,影響力不斷壯大,臨床轉化與推廣步伐加快。與此同時,國外法規、監管與標準化研究處于新的活躍期,對國內的工作帶來有益的啟示。
在此背景下,人工智能醫療器械標準化技術歸口單位(以下簡稱歸口單位)緊密跟蹤監管需求和行業動態,在國家藥監局的領導下積極開展工作。本文對近年的進展進行總結,對后續計劃和任務進行展望。
國外動態與分析
當前,人工智能作為熱點創新技術,廣泛應用于包括醫療器械在內的各行各業,各國針對人工智能本身的監管認識與法規建設不斷升級。
今年4月,歐盟發布了人工智能立法框架,提出了人工智能風險分級管理的理念。其中,人工智能的醫學應用被劃入了高風險的等級,預示著對人工智能醫療器械的監管將趨于嚴格。該立法框架與歐盟在2019年所提出的“可信賴的人工智能”倫理理念一脈相承,從人與AI的關系出發,旨在強調和保護人的安全、權益和公平。
美國FDA在今年1月份發布了《基于人工智能/機器學習的醫療器械軟件行動計劃》。該計劃回應了2019年FDA發布的《基于人工智能/機器學習的醫療器械軟件變更監管框架》收到的社會反饋。在質量管理方面,該計劃繼續研究軟件持續學習背景下的預定義變更控制的指南草案,開發良好機器學習規范以評估和改進機器學習算法。在監管要求方面,該計劃提倡以患者為中心的路徑,包括器械對用戶的透明度,與歐盟的立法框架存在相通之處。在質量評價方面,該計劃重視對算法偏倚和魯棒性的評價,推動真實世界性能監測的試點。
國際醫療器械監管者論壇(IMDRF)的人工智能醫療器械工作組在今年組織了多次線上會議。各國監管機構的代表圍繞基于人工智能/機器學習的醫療器械術語文稿的編制展開了細致的討論。其中,歐美各國關注持續學習、算法變更等關鍵詞,重視良好機器學習規范在質量管理中的作用,值得關注。
根據國外的發展趨勢,人工智能倫理思想、全生命周期質量管理的理念、產品快速更新的需求等因素對人工智能醫療器械的標準化產生了較大影響,產品的測試思路也在轉型,與傳統計算機輔助診斷軟件產品的差異越來越大。
國內標準化進展
2020年我國首批人工智能醫療器械行業標準《人工智能醫療器械 質量要求與評價 第1部分:術語》和《人工智能醫療器械 質量要求與評價 第2部分:數據集通用要求》已經進入報批階段。《人工智能醫療器械 質量要求與評價 第1部分:術語》旨在為人工智能醫療器械的質量評價提供基礎通用的術語,為后續標準的起草提供字典。該標準在基礎共性技術、數據集、質量評價指標、質量評價方法、應用場景等方面給出了一百多個詞條及定義,并以附錄的形式給出了部分公式。《人工智能醫療器械 質量要求和評價 第2部分:數據集通用要求》旨在把數據集納入人工智能醫療器械的質量評價體系,明確數據集的評價對象及技術路徑。該標準借鑒了醫療器械領域、信息技術領域、臨床試驗等領域對數據質量的管理思路,結合了人工智能可解釋性、可溯源性等方面的需要,提出了數據集的描述文檔、質量特性、風險分析文檔等方面的要求,并給出了評價方法。同時,中檢院聯合中華醫學會放射學分會、國家衛生健康委能力建設與繼續教育中心等共同發布了《胸部CT肺結節數據集及質量控制專家共識》,為標準的落地提供參考。
根據國家藥監局公示的標準制修訂計劃,2021年中檢院作為歸口單位圍繞《人工智能醫療器械 質量要求和評價 第3部分:數據標注通用要求》和《人工智能醫療器械 肺部影像輔助分析軟件 算法性能測試方法》兩個主題開展標準立項起草工作。
數據標注是影響人工智能醫療器械質量的重要技術服務,直接關系到算法研發與測試所依據的參考標準的準確性和可靠性。目前業內在數據標注環節的差異較大,標注的實施主體、工作流程、質控與驗收等環節參差不齊,急需標準規范。《人工智能醫療器械 質量要求和評價 第3部分:數據標注通用要求》在參照國內臨床領域人工智能數據標注專家共識基礎上,對標注任務的定義、描述、組織等相關內容進行了規定,把相關的技術工具、平臺納入考量。該標準草案也是對《人工智能醫療器械 質量要求和評價 第2部分:數據集通用要求》的呼應和補充,有助于促進數據集的開發活動。
《人工智能醫療器械 肺部影像輔助分析軟件 算法性能測試方法》是中檢院歸口單位標準立項的第一個方法標準草案,面向肺結節、肺炎等臨床用途的人工智能醫療器械軟件的測試需求,描述了輔助診斷、輔助檢測等場景下的常見指標與測試方法。同時,該標準草案根據近年來人工智能軟件測試的發展趨勢,對人工智能醫療器械軟件的一些特殊性能提出考量,包括對抗測試、壓力測試等。
2021年3月,中檢院歸口單位召集來自臨床、教育、科研、企業等領域的專家,形成了標準草案的框架。在起草組的配合下,標準草案的初稿已完成編制,在歸口單位內部進行了研討。下一步,歸口單位將結合具體的產品開展技術驗證工作。
與此同時,中檢院歸口單位在年初面向社會啟動了2022年度標準立項征集工作,共收到立項提案20余份,提案內容涉及基礎通用要求、臨床試驗特殊要求、軟件開發管理、算法性能測試、數據集專用要求等主題。本年度的部分提案內容參考了國外2020年發布的技術文獻,與國際前沿的接軌程度有所提升,反映了國內各界對標準研究的熱情和投入。為了確保提案遴選的科學性和效率,秘書處依據醫療器械標準制修訂工作規范,在6月底舉行線上線下相結合的標準研討會,組織歸口單位專家組進行專題研究和投票,下一步將按照標準制定程序辦理后續事宜。
國際標準合作進展
在推進國內標準研究的同時,歸口單位也在積極拓展國際合作。2021年3月,國家藥監局和國家標準委批復同意由中檢院專家加入國際電工委員會IEC TC62委員會的軟件網絡與人工智能顧問團,參與IEC在醫療器械創新領域的國際標準研究。在顧問團的首個正式研究報告中,中檢院承擔了部分章節的編寫和校對任務,宣傳了我國在人工智能醫療器械監管與標準化方面取得的研究成果,獲得了顧問團的認可。
中檢院牽頭的IEEE人工智能醫療器械標準也取得了顯著的進展。在近期的工作組會議上,來自中國、美國、德國、荷蘭等國的十余個成員單位對IEEE P2802 人工智能醫療器械質量評價術語標準的技術內容進行了審議并達成共識,即將提交IEEE進行文稿格式審查,啟動外部投票與征求意見進程。該標準在起草階段即獲得了國際同行的關注,已被美國NIST的人工智能標準體系規劃、美國FDA的機器學習/人工智能行動計劃、美國ANSI CTA 2089-1標準等文件引用。該標準在凝聚我國國內行業共識的基礎上形成初稿,在國際交流的背景下進行了修改完善。它的起草與發布有助于增進國內外的標準協調與合作。IEEE P2801數據集質量管理標準草案在今年也推出了新的版本,即將進行組內的技術審議。
標準落地應用進展
為了促進標準的落地應用、提升產品檢測服務能力,中檢院在科技部重點研發計劃項目的資助下,正在建設醫學人工智能產品檢測平臺,面向科研院所、企業、臨床機構、檢測機構等開展應用示范。平臺使用中心化云端部署的模式,使用私用數據和公有數據相結合的渠道,打通數據集開發與質控、數據標注、測試方案定制、算法指標評估、對抗測試等關鍵環節,形成可定制、標準化的產品測試服務模式,滿足產品上市前測試、臨床在用質控、真實世界性能監測、算法更新與再評價等階段的評價需求,從而支持人工智能產品的全生命周期質量控制。
在開發階段,項目組集成了智能檢索、智能標注、對抗攻擊等先進技術,擴展了產品魯棒性、臨床性能動態評估等方面的評價能力。在項目參與單位的共同努力下,包含數據入庫、人員管理、檢測業務申請、待測算法部署、數據中臺、檢測報告編輯等在內的主要模塊基本達到中期設計指標,平臺處于聯合調試和內測階段。目前,已有十余家來自企業、檢測機構、臨床機構的用戶參與平臺的調試,待測產品涉及肺部影像、眼底彩照、心電、血糖、電子病歷等數據模態。同時,項目組完成4個單模態典型樣板數據集、2個多模態典型樣板數據集,為數據集的社會共籌共建模式提供了參照。平臺預計在今年10月份正式上線并面向社會征集應用示范單位,提供公益技術服務,支持標準的應用落地和宣貫培訓。
綜上所述,我國人工智能醫療器械標準化工作在理論與實踐兩方面協同推進,密切關注國內外行業與監管形勢的變化。隨著我國人工智能醫療器械產業的發展壯大和監管科學研究的推進,我國的人工智能醫療器械標準化工作逐步走向自主創新的道路,為行業和監管需求提供技術保障。(王浩 李佳戈 李靜莉作者單位:中國食品藥品檢定研究院)
來源于|中國醫藥報