人気ブログランキング | 話題のタグを見る
ブログトップ

EARLの医学ノート

drmagician.exblog.jp

敗血症をメインとした集中治療,感染症,呼吸器のノート.医療におけるAIについても

【AI】ChatGPT-o1に匹敵するオープンソースのAIモデルDeepSeek-R1が登場!

【AI】ChatGPT-o1に匹敵するオープンソースのAIモデルDeepSeek-R1が登場!
【AI】ChatGPT-o1に匹敵するオープンソースのAIモデルDeepSeek-R1が登場!_e0255123_15190968.png

■2025年1月20日に中国のAIスタートアップ企業である深度求索(英語ブランド名:DeepSeek Research)からオープンソースAIであるDeepSeek-R1がリリースされた.その性能は,三大大規模言語モデル(LLM)であるChatGPT,Claude,Geminiの牙城を崩すレベルであり,ベンチマークスコアではChatGPT-o1に匹敵するレベルである.

1.DeepSeekはどこの企業が開発した?

■DeepSeekを開発したのは深度求索である.中国は杭州に拠点を置くこの企業は,中国の大規模ヘッジファンド企業「幻方量化(Huanfang Quant)」の資金で設立された子会社であり,外部からの資金調達は一切ない.本企業は
①単に既存のモデルを模倣するのではなく,モデルアーキテクチャの根本的な革新にフォーカスする
②具体的な目標やタスクを与えず,自由に研究させる独自の社風
③社会貢献としての低コスト,技術を独占しないオープンソース戦略
という特徴がある.

2.DeepSeek-R1の特徴

■DeepSeek-R1は,複雑な問題解決に特化した高性能な推論型LLMである.数学やコーディング,複雑な質問に回答するタスクを専門としている.DeepSeek-R1は,6710億のパラメータと128Kトークンのコンテキスト長を持ち,DeepSeek-V3-Baseと呼ばれるMixture of Experts (MoE) アーキテクチャを採用したモデルをベースに開発された.

(1)強化学習によるo1に匹敵する性能
■最大の特徴は,従来の教師ありファインチューニングではなく,大規模な強化学習によってトレーニングされている点である.これにより,AI自身が試行錯誤を通じて学習する強化学習と,巨大なモデルからより小さなモデルに知識を伝達する蒸留と呼ばれる技術を組み合わせることで,複雑な問題を解決するための思考の連鎖(Chain of Thought: CoT)を探索することを可能にした.

DeepSeek-R1は,複数の数学・コーディング・推論のベンチマークにおいて,OpenAIのChatGPT-o1に匹敵する性能を示している
【AI】ChatGPT-o1に匹敵するオープンソースのAIモデルDeepSeek-R1が登場!_e0255123_15205647.jpg

■DeepSeek-R1で特筆すべきはAha Moment(アハモーメント)であろう.これは,DeepSeek-R1の学習過程で観察された「モデルが突然,問題解決の新しい方法を発見する瞬間」を指す.これは,強化学習を通じてモデルが自律的に推論能力を向上させる過程で現れる非常に興味深い現象である.具体的にはテクニカルレポートの7-8ページにあるが,強化学習の途中過程で,モデルが数学の問題解決タスクの計算ステップで行き詰まった際に,「Wait, wait. That’s an aha moment I can flag here.(あ,待てよ.ここがまさに『気づきの瞬間』だ)」という内部的な「気づき」を生成し,問題を再構築し,ステップバイステップで再計算を試みて最終的に正しい解を導出するに至った.これは,強化学習を通じて,モデルが「自己修正」や「再検討」の能力を自律的に獲得したことを示しており,人間の「ひらめき」に近いプロセスをAIが再現できる可能性を実証したことになる.
【AI】ChatGPT-o1に匹敵するオープンソースのAIモデルDeepSeek-R1が登場!_e0255123_15211894.png

(2)超低価格の実現
■このモデルはオープンソースであり,MITライセンスのもとで提供されているため,誰でも自由に使用,修正,そして商用利用することができる.既存の三大LLMに比して極めて自由度が高い.加えて,Web版やアプリ版は無料,API価格はOpenAI o1の約27分の1と,圧倒的な低価格で利用できる

(3)推論の思考プロセス■多くのAIモデルとは異なり,推論プロセスを段階的にユーザーインターフェースに表示するため,信頼性が高く,デバッグが容易である.具体的には,以下のプロセスで回答を生成している.
1. 問題の解析とフレームワーク構築
- 入力の構造化: ユーザーの質問を自然言語処理(NLP)で解析し,キーワードや文脈を抽出
- タスクの分類: 問題を「数学」「コーディング」「論証」などドメイン別に分類し,適切な推論モードを選択

2.知識の活性化と関連情報の検索
- 内部知識ベースの参照: 事前学習済みの数理公式やコードパターンを検索
- 類似問題の抽出: 過去の学習データから類似ケースを比較

3.仮説の生成と優先順位付け
- 複数アプローチの列挙: 解決策の候補を生成
- スコアリング: 各手法の計算効率や正確性を評価し,最適な順序で実行

4.段階的実行と中間検証
- ステップバイステップ実行: 各計算ステップを詳細に記録し,中間結果を逐次チェック
- 自動検証: 数値計算や論理矛盾をリアルタイムで検出

5.フィードバックループによる修正
- エラー検出時: 矛盾が生じたステップに戻り,代替アプローチを試行
- 動的方針変更: 計算が複雑化した場合、より単純な手法に切り替え

6.結論の統合と説明生成
- 回答の構造化: タグ内に思考プロセス,に最終結論を明示
- 可読性の最適化: 数式のLaTeX整形,自然言語での要約を付加

7.メタ認知による品質保証
- 自己評価: 回答の信頼度をスコア化
- 例外処理: 未解決の問題は「回答不能」と明示し,追加情報を要求
■この抽出された推論プロセスの思考をClaudeに tagで組み込むことで,Claudeは自分の思考だと錯覚し,自身の限界を超えた推論能力を発揮できるようになる(もっとも,推論プロンプトを使えばDeepSeek-R1の推論プロセスを用いずとも可能ではある).

■なお,思考プロセスは,日本語,英語,中国語のいずれかで表示されるが,これもプロンプトで指定が可能である.ただし,DeepSeek-R1は設計上英語で思考を行う方が精度が上がるとされており,「思考は英語で,出力は日本語で」と指示すると,英語で思考を行いつつ,思考プロセスの表示は日本語にできる

(4)サイズの小さい蒸留モデル

■DeepSeek-R1は,671Bパラメータのフルモデルに加えて、1.5Bから70Bパラメータまでの6種類の軽量版モデルが用意されており,1.5BであればPCやスマートフォンに入れることができ,高性能AIモデルをオフラインで使用できる.これは,大規模で高度なAIシステムが,より小規模で単純なモデルと知識を共有するという,モデル蒸留と呼ばれるAIのトレンドの一環である.DeepSeek-R1蒸留モデルは,大規模なテック企業だけでなく,すべての人が最先端のAIを利用できるようにするというDeepSeekの理念を体現している.

(5)Web検索との組み合わせ
■Web版では,DeepSeek-R1とWeb検索を組み合わせることも可能である(ただし,Web検索自体をDeepSeek-R1が行うわけではないので,同時起動の意味はたいしてないものと思われる).また,AI検索ツールのFelo,GensparkでもDeepSeek-R1が使用可能となった.

(6)内部ガイドラインの存在
■中国製のAIモデルということもあり,天安門事件等の質問に対しては回答を拒否する特徴がある(ただし,比較的簡単なインジェクションプロンプトで回答するようにはなる).実際このあたりの質問に関しては思考プロセスの中で「内部ガイドライン遵守」という言葉が出現している.

3.DeepSeek-R1の使用方法
■DeepSeek-R1はアカウント登録をした上で以下の方法で使用できる.APIを使用しないならばアプリ版がおすすめである.

(1)Web版(無料)
◾️https://chat.deepseek.comにアクセスし,プロンプト入力欄の下にある「DeepThink (R1)」ボタンを押すと使用できる.

(2)アプリ版(無料)
■iOSでもアンドロイドでもアプリがリリースされている.プロンプト入力欄の下にある「深く考える」ボタンを押すと使用できる.ただし,アプリ版では,「深く考える」と「Web検索」の同時使用はなぜかできない(ただし,同時使用してもしなくてもたいして変わらない).
iOS版
https://apps.apple.com/jp/app/deepseek-ai-assistant/id6737597349

アンドロイド版
https://play.google.com/store/apps/details?id=com.deepseek.chat&pcampaignid=web_share
(3)API(有料)
■DeepSeekのAPIに接続することでDeepSeek-R1を自身のアプリケーションに統合することが可能である.料金は,100万トークンあたり,出力が$2.19(≒340円),入力が$0.55(≒85円)である.

(4)ローカル実行(無料)
■OllamaやHugging Faceなどのツールを使用して,DeepSeek-R1のモデルをダウンロードし,ローカル環境で実行することができる.

(5)Poe(無料)
■多数のAIを使用できるプラットフォームであるPoeで使用できる.無料ユーザーでも可能だが,1メッセージあたり2400ポイントと,なぜか消費ポイントが大きいため,Poeで使う必要はない.

(6)Felo(無料でも可能)
■AI検索ツールFeloで使用できる.無料ユーザーでもPro検索として1日5回まで,ファイル分析として1日3回まで使用できる.

(7)Genspark(有料)
■AI検索ツールGensparkで使用できる.

4.セキュリティは?

■DeepSeekは中国製であるため,バックドア等セキュリティを心配する声もある.ただ,本AIモデルのアプリは,GooglePlayやAppStoreの厳しい審査をクリアしていること,オープンソースであるため誰でもソースコードを検証できることから,現時点でその心配はほぼ杞憂であろう.もっとも,中国製か否かにかかわらず,オンラインのAIモデルに機密情報や個人情報は入力しないのが基本であるため,そのルールに則れば心配は不要である.

by DrMagicianEARL | 2025-01-24 15:22 | 医学・医療とAI

by DrMagicianEARL