Corti医療音声認識、誤り率1.4%でOpenAIに圧勝
詳細を読む
デンマーク・コペンハーゲン発の医療AI企業Cortiは2026年5月20日、臨床特化型の音声認識モデル「Symphony for Speech-to-Text」を正式リリースしました。英語の医療用語における単語誤り率(WER)はわずか1.4%で、OpenAIの17.7%、ElevenLabsの18.1%、Whisperの17.4%を大幅に下回り、最大93%の精度改善を示しています。
同モデルの強みは、投薬量・測定値・日付などの臨床エンティティの再現率にも表れています。Cortiは98.3%を達成した一方、汎用モデルの最高値は44.3%にとどまりました。この54ポイントの差は、AIスクライブが医療現場で信頼されるか、医療過誤リスクとなるかの分水嶺です。
レガシー製品との比較でも優位性は明確です。医療音声認識の業界標準Dragon Medical Oneに対し、実臨床の英語ディクテーションでWER 4.6%対5.7%と19%の相対改善を達成しました。さらにスイスの多言語環境ではドイツ語2.4%、フランス語3.9%と、次点のシステムを大きく引き離しています。
Cortiの共同創業者兼CEOであるAndreas Cleve氏は、エージェントAI時代における音声認識の役割変化を強調しています。従来の音声認識は静的な文書生成が目的でしたが、自律型AIエージェントが臨床判断を支援する時代では、音声データは下流のAI推論の基盤となります。誤認識はすべての後続処理に波及するため、臨床グレードの精度が不可欠です。
今回の発表は、医療コーディングや臨床推論ベンチマークに続く6週間で3件目の成果です。汎用モデルが規制産業で天井に達しつつあるなか、垂直特化型AIラボの優位性を裏付けるデータが蓄積されています。Cortiのプラットフォームは英国NHSを含む医療機関を通じ、年間1億人以上の患者にサービスを提供しており、開発者登録は前四半期比30%増と勢いを増しています。