SambaNova、DeepSeek-R1 671Bを最速・最高効率(注1)で提供開始
SambaNova、DeepSeek-R1 671Bを最速・最高効率(注1)で提供開始【写真詳細】
SambaNovaは、DeepSeek-R1 6710億パラメータモデルの推論を効率的に実行するためのハードウェア要件を40ラック(320基のGPU)から1ラック(SambaNova独自のAIアクセラレータであるRDUが16基)に集約し、最新GPUの3倍の速度、5倍の効率を実現
@カリフォルニア州パロアルト、2025年2月13日 — 最も効率的なAI半導体と最速のモデル(注2)を提供する生成AI企業であるSambaNovaは、本日DeepSeek-R1 671BがSambaNova Cloud上で198トークン/秒で稼働していることを発表しました。この速度と効率は他のプラットフォームでは実現できません。
DeepSeek-R1はAIのトレーニングコストを10分の1に削減しましたが、高い推論コストと非効率性が普及の障壁となっていました。SambaNovaはこの障壁を取り除き、リアルタイムでコスト効率の高い大規模推論を開発者や企業向けに提供します。
SambaNovaのCEO兼共同創業者であるロドリゴ・リヤンは「SN40L RDU半導体によって駆動されるSambaNovaは、DeepSeekを198トークン/秒/ユーザーという最速の速度(注1)で実行できるプラットフォームです。この速度は単一ラックで最新GPUの5倍に達し、年末までにはDeepSeek-R1向けのキャパシティを100倍に拡張します」と述べています。
DeepLearning.AIの創設者であり、AI Fundのマネージング・ゼネラル・パートナー、スタンフォード大学コンピュータサイエンス学科の客員教授でもあるアンドリュー・ン博士は次のようにコメントしています。 「SambaNovaの驚異的な速度で、蒸留されたバージョンではなく、フルサイズのDeepSeek-R1 671Bモデルを実行できることは、開発者にとって画期的です。R1のような推論モデルは、優れた出力を得るために多くの推論トークンを生成する必要があり、従来のLLMよりも処理時間が長くなります。したがって、このようなモデルの高速化は特に重要です。」
Artificial Analysisの共同創業者であるジョージ・キャメロン氏は「Artificial Analysisは、SambaNovaのクラウド上で稼働する6710億パラメータのDeepSeek-R1 Mixture of Expertsモデルの独自ベンチマークを実施し、195トークン/秒以上の出力速度を記録しました。これは、これまでに測定したDeepSeek-R1の中で最速の出力速度(注1)です。推論モデルにおいては、高速な出力が特に重要であり、推論トークンの出力速度が向上することで、応答の品質を向上させることができます。SambaNovaの高い出力速度は、レイテンシーに敏感なユースケースでの推論モデルの活用を支援します」と述べています。
SambaNovaがDeepSeekの最大の課題を解決:大規模推論の実現
DeepSeek-R1は、AIのトレーニングコストを10分の1に削減し、AIの発展を加速させました。しかし、推論時に必要な計算量が大幅に増大するため、GPUベースの推論の非効率性がDeepSeek-R1の普及を妨げ、多くの開発者にとって手の届かない存在となっていました。
SambaNovaはこの問題を解決しました。独自のデータフローアーキテクチャと3層メモリ設計により、SambaNovaのSN40L Reconfigurable Dataflow Unit(RDU)チップは、DeepSeek-R1 671Bを実行するためのハードウェア要件を、40ラック(最新GPU320基)から1ラック(16基のRDU)に削減し、コスト効率の高い推論を実現します。
SambaNova CEOのロドリゴ・リヤンは「DeepSeek-R1は最も先進的なフロンティアAIモデルの一つですが、GPUの非効率性がその可能性を制限していました。しかし、本日をもって状況は一変します。推論コストを劇的に削減し、ハードウェア要件を40ラックから1ラックへと縮小し、最高速で効率的なDeepSeek-R1を提供します(注1)」と述べています。
Blackbox AIのCEO、ロバート・リズク氏は「Fortune 500企業のエンジニアリングチームを含む1,000万人以上のユーザーが、Blackbox AIを活用してコードの作成や製品開発を変革しています。SambaNovaとの提携は、自律型コーディングエージェントのワークフローを加速させる上で極めて重要です。SambaNovaの半導体は、フルサイズのDeepSeek-R1 671Bモデルを効率的に提供できる唯一無二の性能を誇り、蒸留版よりも圧倒的に高い精度を実現します。数百万のユーザーを支えるために、これ以上のパートナーは考えられません」と述べています。
近日公開:世界で最も効率的なDeepSeek API – 現在のグローバルキャパシティの100倍
SambaNovaのチーフアーキテクトであるスムティ・ジャイラットは「DeepSeek-R1は、SambaNovaの三層メモリアーキテクチャに最適なモデルです。R1は6710億パラメータを持つ、これまでに公開された最大のオープンソース大規模言語モデルであり、その動作には膨大なメモリが必要となります。従来のGPUはメモリの制約を受けますが、SambaNova独自のデータフローアーキテクチャにより、メモリとデータ通信のボトルネックを克服し、近い将来にはラック全体で毎秒20,000トークンという前例のないスループットを達成できる見込みです。」と述べています。
SambaNovaは、今後の需要の増加に対応するため、計算能力の大幅な拡張を進めています。本年末までに、DeepSeek-R1向けのグローバルな計算リソースを現在の100倍以上に拡大する予定です。これにより、SambaNovaのRDUは、推論モデル向けの最も効率的なエンタープライズソリューションとなります。
SambaNova CloudでR1の早期アクセスを提供開始
DeepSeek-R1 6710億パラメータのフルモデルが、すべてのユーザー向けに提供開始されました。また、一部の選定ユーザーにはAPI経由での利用も可能です。今すぐ体験するには、cloud.sambanova.ai にアクセスしてください。
(注1)Artificial Analysis社調べ
(注2)SambaNova Systems調べ
SambaNova Systems について
最先端の生成AI機能を企業内に迅速に展開するために、SambaNovaに注目が集まっています。 SambaNovaのエンタープライズスケールのために構築されたAIプラットフォームは、次世代の生成AIコンピューティングのための技術的バックボーンです。
カリフォルニア州パロアルトに本社を置くSambaNova Systemsは、業界の著名人や、サン/オラクルおよびスタンフォード大学のハードウェアおよびソフトウェア設計の専門家によって、2017年に設立されました。投資家には、SoftBank Vision Fund 2、BlackRock、Intel Capital、GV、Walden International、Temasek、GIC、Redline Capital、 Atlantic Bridge Ventures、Celestaなどが含まれています。sambanova.ai をご覧いただくか、info@sambanova.ai までご連絡ください。Linkedinで SambaNova Systems をフォローしてください。
プレスリリース情報提供元:ValuePress!
スポンサードリンク
SambaNova Systemsの記事
IT・テクノロジーの最新プレスリリース
- 創価学会員限定の婚活サービス「創価カップル」、登録者数1万人・カップル成立数500組を突破!
- <調査報告>ECサイトのカゴ落ち率は平均約63.3%、機会損失額は売上の約2.7倍。~株式会社イー・エージェンシー
- 【GALLERIA】「NIGHT HIKE Early2025」に協賛 来場者にシリコンバンドをプレゼント&サイン入りグッズが当たるXキャンペーン開催
- 公式ショップ 「8の付く日 5%OFFクーポンセール(一部セール除外品あり)」明日2025年3月15日(土)から3月31日(月)まで開催
- AI動画編集ソフト「HitPaw Edimakor」最新版3.6.0をリリース!写真から動画生成&バイラル動画作成機能が新登場
- 【GALLERIA】「VALORANT Challengers Japan 2025」 大会協賛モデルを販売開始 オリジナル壁紙の特典付き
- 新潟大学「駅南キャンパスときめいと」で「OpenRoaming」「eduroam」に対応した公衆無線LANの提供を開始
- 「ビューティーワールド ジャパン 東京」にLINEを利用した自動予約管理システム「リピッテビューティー」が出展します。
- 【ドスパラ】ドスパラセレクトから360mm水冷CPUクーラーが登場 最新CPUにも対応 高性能で強力な冷却力
- 【GALLERIA】最新プロセッサ「AMD Ryzen(TM) 9 9950X3D」搭載パソコン販売開始