Multiverse Computing pushes its compressed AI models into the mainstream

要約

スペインのスタートアップMultiverse Computingは、OpenAI、Meta、DeepSeek、Mistral AIなどの主要AIモデルを軽量化する技術「CompactifAI」を本格展開する。同社は、端末内でオフライン動作するAIチャットアプリと、企業向けAPIポータルを公開した。これにより、データセンターへの依存を減らし、プライバシー保護とコスト削減を両立する「エッジAI」の普及を目指す。最新モデル「HyperNova 60B」は、元モデルより高速かつ低コストな推論を実現しており、特に自律的なコーディング作業での活用が期待されている。

背景情報

* 計算リソースの逼迫: AI需要の急増により、クラウドの計算能力確保が困難かつ高コスト化しており、VC（Lux Capital等）は企業に対し、外部依存リスクへの警戒を強めている。
* エッジAIの台頭: データを外部サーバーに送らず、ユーザーの端末内で処理を完結させる「エッジAI」は、プライバシー保護と通信遅延の解消という観点から注目を集めている。
* 技術的課題: モデルを軽量化しつつ、実用的な推論能力を維持することは困難であり、Appleなどの大手も端末とクラウドを併用するハイブリッド方式を採用している。