特此通告。
附件:肺炎CT影像輔助分診與評估軟件審評要點(試行)
國家藥品監督管理局
醫療器械技術審評中心
肺炎CT影像輔助分診與評估軟件審評要點(試行)
一、適用范圍
本審評要點適用于肺炎CT影像輔助分診與評估軟件的產品注冊。該類產品基于肺部CT影像,采用深度學習技術進行肺炎影像學異常識別,臨床用于新型冠狀病毒肺炎疑似患者的分診提示以及確診患者的病情評估。
按現行《醫療器械分類目錄》,該類產品分類編碼為21-04-02,管理類別為三類。
二、基本要求
生產企業應依據《醫療器械軟件注冊技術審查指導原則》《醫療器械網絡安全注冊技術審查指導原則》《移動醫療器械注冊技術審查指導原則》《深度學習輔助決策醫療器械軟件審評要點》等相關指導原則與審評要點,提交相應注冊申報資料。
該類產品的軟件安全性級別為B級,生產企業應依據《醫療器械軟件注冊技術審查指導原則》提交相應軟件描述文檔。其中,核心算法所述深度學習算法應依據《深度學習輔助決策醫療器械軟件審評要點》提交相應算法研究資料。
生產企業應依據《醫療器械網絡安全注冊技術審查指導原則》提交網絡安全描述文檔。其中,基本信息應圍繞數據類型進行描述;風險管理、驗證與確認應基于19項網絡安全能力進行分析和實施,不適用項詳述理由;可追溯性分析報告應追溯網絡安全需求、設計、測試、風險管理的相互關系;維護計劃應包含網絡安全日常維護計劃、網絡安全事件應急響應預案。
若使用云計算服務、移動計算終端,生產企業應依據《移動醫療器械注冊技術審查指導原則》提交相應研究資料。其中,使用云計算服務應明確服務模式、部署模式、核心功能、數據接口、網絡安全能力、服務(質量)協議等要求;使用移動計算終端應結合終端的類型、特點、使用風險明確相應性能指標要求。
生產企業應單獨出具一份軟件版本命名規則真實性聲明。明確軟件發布版本、軟件完整版本,涵蓋算法驅動型軟件更新和數據驅動型軟件更新;區分重大軟件更新和輕微軟件更新,其中重大軟件更新應列舉全部典型情況。
三、風險管理
生產企業應基于軟件的預期用途、使用場景、核心功能開展風險管理。重點分析假陰性和假陽性風險,特別是假陰性風險,明確相應風險控制措施,確保軟件綜合剩余風險均可接受。
四、軟件研究
生產企業在準備軟件研究資料時應重點關注以下方面要求:
(一)軟件功能至少包含異常識別、量化分析(如病灶體積占比、CT值分布等)、數據對比(手動、自動均可)、報告輸出。其中,異常識別用于疑似患者的分診提示,量化分析和數據對比用于確診患者的病情評估。
(二)訓練數據原則上不少于2000例新型冠狀病毒肺炎確診患者CT影像;至少來源于3家醫療機構,其中至少包含1家疫情嚴重地區醫療機構;至少包括早期、進展期的新型冠狀病毒肺炎CT影像。
(三)明確CT影像要求,包括CT設備兼容性與掃描參數、CT影像質量等因素,如廠家、排數、層數、層厚、管電壓、管電流、加載時間、圖像偽影與噪聲等要求,并提供相應支持材料。
(四)結合人群特征(如性別、年齡)、影像學分期(早期、進展期、嚴重期)、數據來源機構、CT設備(如廠家、層厚)等因素,提供新型冠狀病毒肺炎CT影像的數據分布情況。
(五)明確數據標注的流程以及質控要求。
(六)提供訓練集、調優集、測試集的數據量以及數據分布情況,明確新型冠狀病毒肺炎、其他類型肺炎等類似病征的占比,保證測試集陽性樣本與陰性樣本的比例合理。
(七)明確數據擴增的對象、方法、倍數,分析擴增倍數過大的影響及其風險。
(八)提供算法結構、流程圖,明確輸入與輸出、所用現成深度學習框架。
(九)明確算法訓練的評估指標、訓練目標及其確定依據,提供訓練數據量-評估指標曲線、ROC曲線等證據。
(十)結合CT設備、影像學分期、類似病征等因素,提供算法性能影響因素分析報告。
五、臨床研究
該類產品臨床評價方式與其必備的軟件功能類型有關。用于分診提示的異常識別功能屬于輔助決策類軟件功能,需要開展臨床試驗,可采用回顧性研究。用于病情評估的量化分析等功能屬于非輔助決策類軟件功能,可根據《醫療器械臨床評價技術指導原則》提交相應臨床評價資料,也可在臨床試驗中予以評價。
分診提示的臨床試驗要求具體如下:
(一)試驗目的
生產企業應根據產品適用范圍確定臨床試驗目的。適用范圍考慮因素包括但不限于:目標疾病(肺炎)、臨床用途(分診提示)、禁忌癥(如某些類似病征)、預期適用人群(如具有新型冠狀病毒肺炎流行病學史、臨床表現的患者)、預期使用場所(如定點醫院、方艙醫院)、預期目標用戶(如放射科醫師)、預期兼容的CT設備等。
臨床試驗目的主要對分診提示的診斷準確度進行確認。
(二)試驗設計
可采用單組目標值試驗設計,以分診提示的敏感性、特異性等固有診斷準確度指標作為主要評價指標。
目標值應符合臨床應用需求,可來源于權威醫學組織、相關標準化組織發布的客觀性能標準,也可基于影像科醫師診斷目標疾病準確度的臨床數據經薈萃分析來構建性能目標。生產企業應明確目標值的確定依據。
(三)受試對象
受試對象應包含一定樣本量的陽性病例和陰性病例。按照《新型冠狀病毒肺炎診療方案(試行第六版)》,陽性病例為具有肺炎影像學特征的新型冠狀病毒肺炎疑似病例,陰性病例為未見肺炎影像學特征的病例。在此基礎上,病例的選擇還需綜合考慮以下因素:
1.臨床試驗納入病例應獨立于產品開發所用病例;
2.臨床試驗納入病例需來源于不同地域醫療機構;
3.選擇性入組病例可能導致研究人群與預期適用人群存在較大差異,建議連續入組符合入排標準的病例,以消除或減小選擇性偏倚;
4.需考慮陽性病例中新型冠狀病毒肺炎分型、分期的分布合理性。
(四)評價指標
主要評價指標原則上應考慮將病例水平的敏感性和特異性組成復合終點。
次要評價指標可包括分診提示時間、軟件易用性(可采用主觀感受評價,如李克特量表等)和安全性等。若同時觀察量化分析等功能的臨床安全有效性,可設立相應次要評價指標。
(五)金標準構建
生產企業應詳述金標準的選擇、構建方法及理由。可供選擇的金標準構建方法包括:一是以臨床確定結果為金標準,即流行病學史、臨床表現(含影像學特征)的綜合診斷結果;二是通過專家閱片小組構建金標準。
若選用后者,需明確專家數量、來源科室、專家資質要求(如職稱)、專家相關培訓要求、培訓效果評測(判定一致性)、結果判定標準、結果判定規則(如少數服從多數,雙人背靠背評判,高水平醫師仲裁)、專家抽取標準(隨機抽取或順序輪轉)等。建議由來自影像科、呼吸科等多個科室的醫師聯合閱片,以減少不完美金標準的偏倚。
(六)樣本量
樣本量估算需綜合考慮臨床試驗設計、主要評價指標和統計學要求。生產企業需明確計算公式、相應參數及確定理由,以及所用的統計軟件。
對于復合終點,樣本量估算需考慮滿足所有單項指標的假設檢驗的樣本量需求。假設軟件的敏感性為95%,臨床認可的目標值為90%,則在雙側顯著性水平0.05、把握度80%,至少需231例陽性病例。假設軟件的特異性為85%,臨床認可的目標值為80%,則在雙側顯著性水平0.05、把握度80%,至少需466例陰性病例。在此基礎上考慮5%-10%脫落率確定最終樣本量。
(七)其他
臨床試驗資料需明確以下信息:
1.病例基線情況統計學描述,包括年齡、性別、流行病學特征、病例數(陽性病例數、陰性病例數)、疾病分型(普通型、重型、危重型)、影像學分期(早期、進展期、嚴重期)等。
2.CT影像采集情況統計學描述,包括數據來源機構、CT設備廠商及型號規格、CT設備掃描參數(如排數、層數、層厚、管電壓、管電流、加載時間)等。
六、說明書
說明書應符合《醫療器械說明書和標簽管理規定》相關要求。明確適用范圍、禁忌癥、使用限制、注意事項、CT設備兼容性與掃描參數要求、CT影像質量要求、算法輸入與輸出、算法訓練總結、算法性能評估總結、軟件臨床評價總結、軟件發布版本、軟件運行環境、使用期限等內容。
七、軟件更新考量
考慮到疫情防控的緊迫性,結合該類產品所具有的數據驅動、快速迭代等特性,上市后軟件更新要求如下:
(一)對于數據驅動型軟件更新,生產企業在疫情期間可通過質量管理體系進行軟件更新質量控制,無需提交許可事項變更申請,但應確保新版本可回滾至已批準版本;待疫情結束后1個月內,生產企業應針對全部軟件更新情況提交許可事項變更申請。
(二)對于算法驅動型軟件更新,生產企業應及時提交許可事項變更申請。
(三)對于其他類型的軟件更新,若發生重大軟件更新,生產企業應及時提交許可事項變更申請;若發生輕微軟件更新,生產企業通過質量管理體系進行軟件更新質量控制,無需提交許可事項變更申請。
(四)若同時發生多種類型的軟件更新,注冊申報要求遵循風險從高原則。例如,同時發生數據驅動型和算法驅動型軟件更新,按照算法驅動型軟件更新處理。
八、其他說明
(一)生產企業應基于產品特性提交注冊申報資料,判斷本審評要點具體內容的適用性,不適用內容應詳述理由。
(二)輔助檢測軟件、輔助診斷軟件風險水平高于輔助分診軟件,原則上應作為不同注冊單元分別申報。
(三)產品若有其他非必備軟件功能,輔助決策類軟件功能注冊申報資料要求參照異常識別功能,非輔助決策類軟件功能注冊申報資料要求參照量化分析功能。
(四)若采用傳統機器學習技術,注冊申報資料要求詳見《深度學習輔助決策醫療器械軟件審評要點》相關說明。
(五)對于進口軟件,生產企業還應考慮中外差異的影響及其風險,并提供相應支持資料。
