さくらインターネット、生成AIを簡単に組み込める「さくらのAI Engine」を一般提供開始

AIニュース3,アイキャッチ

さくらインターネット株式会社は2025年9月24日、生成AI向けの推論API基盤「さくらのAI Engine(エーアイ・エンジン)」の一般提供を開始したと発表した企業や自治体などが、自社サービスに生成AIの機能を手軽に組み込めるのが特徴だ。

「さくらのAI Engine」は、さくらインターネットが提供するクラウドサービス「さくらのクラウド」上で利用できる。大規模言語モデル(LLM)をはじめ、音声認識や検索拡張生成(RAG)など、さまざまなAIモデルをAPIを通じてアプリケーションに統合できる。
これにより、チャットボットやFAQシステム、音声文字起こしサービスなどを短期間で構築可能となる。

【出典元】さくらインターネット、生成AI向け推論API基盤「さくらのAI Engine」を一般提供開始

開発不要で使える生成AI基盤

本サービスは、企業がAIを活用する際のハードルを下げることを目的に開発された。
サーバーやネットワーク構成を自前で用意する必要がなく、REST API経由でAI機能を呼び出すだけで利用できるため、開発や導入の手間を大幅に軽減できる。

さらに、RAG(検索拡張生成)機能も提供され、自社の文書データを活用したチャットボットなどを簡単に実装可能。たとえば、企業の社内文書をAIが検索し、最適な回答を生成するような仕組みも短期間で実現できる。

国内データセンターで安心運用

「さくらのAI Engine」は、さくらインターネットが運営する日本国内のデータセンター上で構築されている。
そのため、データを海外に送ることなく、国内で完結した環境で生成AIを利用できる。公共機関やセキュリティ要件の高い業界でも安心して導入可能だ。

また、推論処理にはNVIDIA製の高性能GPUを採用しており、安定したAI処理を実現。今後も対応モデルや機能の拡充が予定されている。

料金プランと利用枠

料金プランは「基盤モデル無償プラン」と「従量課金プラン」の2種類。
どちらも共通の無償枠が設定されており、たとえばチャットAIは月3,000回まで無料で利用できる。無償枠を超えた場合は、従量課金プランでは利用量に応じて料金が発生する。

サービス内容主なモデル無償枠超過料金(税込)
Chat completionsgpt-oss-120b など3,000回/月入力0.15円・出力0.75円/1万トークン
音声認識whisper-large-v3-turbo50回/月0.5円/60秒
Embeddingsmultilingual-e5-large10,000回/月入力2円/1万トークン

無償プランの申し込み数には上限があり、予定数に達すると新規受付が停止される。

「さくらのAI」ブランドの中核サービスに

今回の提供開始にあわせ、同社はこれまで「さくらの生成AIプラットフォーム」として展開していた基盤サービスの名称を「さくらのAI」に変更した。「さくらのAI Engine」は、その中核となる基盤として位置づけられている。
さくらインターネットは今後、「さくらのAI」を中心に、生成AIを活用したさまざまなビジネス支援サービスを拡充していく方針だ。

関連記事