AI議事録・音声認識/AIコールセンター 日本市場 ボトムアップ市場規模レポート(2026年6月版)
日本のAI議事録・音声認識とAIコールセンター市場を、矢野経済研究所・ITR・富士キメラ総研の一次統計から積み上げで推計。点推定ではなくレンジと前提を全開示し、出典は実在URLで逐語確認した。
日本のAI議事録は「巨大に見えて統計が薄い」典型ニッチだ。音声認識という器は矢野もITRも追っているが、その内訳としてのAI議事録SaaS単体を円建ての金額時系列で出した商用レポはほぼ無く、出回るのはBOXILのような回答者ベースのWebアンケート(シェア%)か、グローバルのドル建てマクロ予測に偏る。理由は構造的で、(1)Zoom/Teams/Google等の会議基盤が文字起こしを「無料included」で飲み込み、専業SaaSの売上が会議プラットフォーム費用に溶けて分離計測しにくい、(2)Notta/Otolio/YOMEL等の新興は非上場で売上非開示、(3)用途が議事録・コンタクトセンター・医療・現場入力に跨り「音声認識」一括統計に紛れる。さらに2025年にはトップ級シェアだったオルツ(AI GIJIROKU)が粉飾で破綻退場し、既存シェア統計の鮮度すら一夜で陳腐化した。大手調査会社にとって「金額が割れない・プレイヤーが喋らない・定義が動く」三重苦の市場で、だからこそボトムアップで前提を晒して積む価値がある。
いま起きていること(出典付き)
- 国内音声認識市場(事業者売上高ベース)は矢野経済研究所が2020年度114億円→2021年度131億円(前年度比14.9%増)と算定し、2025年度を244億円と予測(2020-2025年度CAGR16.4%、2022年1月14日公表。ただし244億は2021年調査時点の予測値で実績未確定)。出典: yanoict.com/657
- ITRは別系統で国内音声認識市場を2023年度150億円(前年度比21.0%増)、2024年度18.0%増、CAGR(2023-2028年度)16.9%、2028年度300億円超と予測(2024年9月5日公表)。用途に『会議の議事録作成』『コンタクトセンター』を明記。出典: itr.co.jp
- コールセンターサービス事業者が提供するAIサービス市場は2023年度60億円→2024年度90億円見込(前年度比150.0%増、矢野経済研究所、2025年4月3日報道)。AIコールセンターの数少ない円建て一次値。出典: nikkei.com(矢野リリース)
- 議事録作成ツールのシェアはBOXILの1,690人インターネット調査(2025年5月14-18日実施)で、Otolio18.80%・Notta12.10%・AI GIJIROKU11.30%・YOMEL9.30%・Rimo Voice6.80%、上位5社で58.3%。回答者ベースの自己申告で売上シェアではない。出典: boxil.jp/mag/a8640
- Nottaは2025年12月9日にシリーズB約23億円(1,500万米ドル、リードGranite-Integral Capital)を調達。同時点で5,000社・1,500万人以上が利用と公表(同年5月のシリーズA+は9.9億円、日経225企業の72%が利用と記載)。出典: thebridge.jp / sogyotecho.jp
- 2025年シェア上位だったAI GIJIROKU運営のオルツは、2022-2024年に約110.7億円(開示売上の8割超)を循環取引で架空計上したとして米倉前社長ら4人が逮捕(2025年10月9日)。民事再生申立は2025年7月30日。出典: nikkei.com
- 参考(グローバル):世界の音声・音声認識市場はMarketsandMarketsが2025年USD9.66B→2030年USD23.11B(CAGR19.1%、2025年8月26日)、世界AI会議アシスタント市場はGrand View Researchが2025年USD3.47B→2033年USD21.48B(CAGR25.8%)と推計。為替150円換算で前者は約1.4兆円規模、日本コア(数百億円)との桁差は成長余地の『参考』に留める。出典: marketsandmarkets.com / grandviewresearch.com
- 国内AI関連市場全体(上位枠)は富士キメラ総研が2024年度1兆4,735億円→2029年度3兆1,779億円(2024年度比2.1倍、2026年3月19日公表)と予測。AI議事録は本統計の一部に溶け込み単体金額の分解記載はない。出典: nikkei.com(富士キメラリリース)
要するに: 要するに、日本のAI議事録・音声認識「コア」は一次統計(矢野244億予測/ITR 150億→300億超)から見て年200〜350億円規模、AIコールセンターを含む「広義」でも生成AIサービス90億円を足して数百億円台前半が現実的な着地だ。グローバルの兆円級ドル予測とは1桁違い、桁差は機会の参考であって日本市場の現状ではない。最大の不確実性は専業SaaS売上が会議基盤に溶けて分離計測できない点と、シェア統計がオルツ破綻で一夜で陳腐化する流動性にある。
規模感(速報): 国内コア(音声認識×議事録/医療/現場)約220〜350億円/年、AIコールセンター含む広義 約450〜650億円/年(いずれも2024-2025年度の事業者売上ベース、前提付きレンジ)
有料部では、この220〜350億/450〜650億をどの一次値からどう積んだか、二重計上リスク・年度ズレ・感度を1行ずつ晒して再現可能にする。