AIモデル動向

世界中のAIモデルの最新進展、技術革新、製品リリースを追跡

AIニュース 2026年5月1日

MiniMax M2.7深層解析：モデルが自らを訓練するエージェント進化路線

MiniMaxがM2.7モデルを発表。「モデルが自身の反復訓練に深く関与する」強化学習パラダイム。SWE-ProでOpusに迫り、入力価格は2.1元/百万トークン。最もコストパフォーマンスの高いAgentコーディングモデルの一つ。

AIニュース注目 2026年5月1日

DeepSeek V4 Pro API 75%割引、Claude Code/OpenClawで1Mコンテキストを解禁

DeepSeek V4 Pro APIが5月5日まで75%の期間限定割引を実施中。Claude Code、OpenClaw、OpenCodeの3ツールが1Mトークンコンテキストに対応。最低コストで兆パラメータMoEモデルを体験できる窗口期。

#DeepSeek #API #Claude Code

DeepSeek V4 Pro API 75%割引、Claude Code/OpenClawで1Mコンテキストを解禁

AIニュース注目 2026年5月1日

月之暗面がKimi K3を発表：2.5兆パラメータ、グローバルトップ tier を目指す

月之暗面が次世代主力モデルKimi K3を正式発表。パラメータ規模は2.5兆に達し、2026年第3四半期のリリースを予定。Kimi K2.6のオープンソースリリースに続き、K3の発表で国際トップモデルとの差をさらに縮める。

#Kimi #月之暗面 #大規模モデル

月之暗面がKimi K3を発表：2.5兆パラメータ、グローバルトップ tier を目指す

AIニュース注目 2026年5月1日

Kimi K2.6、LiveBench で Opus 4.7 を撃破：オープンモデルがクローズドソース旗艦に正面から挑む時代

月之暗面 Kimi K2.6 が LiveBench で Claude Opus 4.7 を超越し、最強オープンモデルに。API 価格は Opus 4.7 の 1/7、オープンモデルが主要评测维度で闭源旗舰に全面对标する時代到来。

#Kimi #月之暗面 #LiveBench

Kimi K2.6、LiveBench で Opus 4.7 を撃破：オープンモデルがクローズドソース旗艦に正面から挑む時代

AIニュース注目 2026年5月1日

Llama 4 Scout：Meta最後のオープンウェイトMoE、10Mトークンコンテキストで入力$0.08/M

MetaがLlama 4 Scoutをリリース——17Bアクティブ/109B総パラメータの16専門家MoE、10Mトークンコンテキスト、入力$0.08/M。Muse Spark閉源前の最後のオープンウェイトMetaモデル。

#Llama #Meta #MoE

Llama 4 Scout：Meta最後のオープンウェイトMoE、10Mトークンコンテキストで入力$0.08/M

AIニュース注目 2026年5月1日

Qwen 3.6 が AI インテリジェンス指数でトップ：27B オープンモデルがクローズドソース巨人に挑む方法

アリババ Qwen 3.6 27B が Artificial Analysis Intelligence Index で 46 点を記録し、150B パラメータ未満のオープンモデルで首位に。ノートパソコン級のモデルがオープンとクローズドソース AI の競争図を書き換えている。

#Qwen #Artificial Analysis #オープンソース

Qwen 3.6 が AI インテリジェンス指数でトップ：27B オープンモデルがクローズドソース巨人に挑む方法

AIニュース注目 2026年5月1日

Qwen3.6-Max-PreviewがSWE-benchでトップ：78.8%スコアがコーディングツールの濠の終わりを宣言

アリババQwen3.6-Max-Previewが1MコンテキストウィンドウでSWE-bench 78.8%を達成、大多数の競合をコーディング能力で上回る。コミュニティの共通認識：単一コーディングツールの差別化濠は消滅し、競争は信頼性とエッジケース処理へ移行。

#Qwen #SWE-bench #コーディングモデル

Qwen3.6-Max-PreviewがSWE-benchでトップ：78.8%スコアがコーディングツールの濠の終わりを宣言

AIニュース 2026年5月1日

OpenClaw v2026.4.29：记忆系统进化，从检索式召回人物感知 Wiki

开源个人 AI 助手 OpenClaw 两天内第二次更新，记忆系统从检索式召回升级为人物感知 Wiki。Agent 可自动构建人物卡片、追踪人际关系图谱，每条记忆带来源追溯和证据类型标注。Active Memory 新增按对话 ID 过滤和持久化标记能力。

#OpenClaw #Agent #记忆系统

OpenClaw v2026.4.29：记忆系统进化，从检索式召回人物感知 Wiki

AIニュース注目 2026年5月1日

AnthropicがBioMysteryBenchを発表：Claude Mythosが人類專家も解けない生物学問題の30%を解決

AnthropicがHugging FaceでBioMysteryBenchをオープンソース化。真實データセットに基づく99問の生物情報学開放問題を含む。そのうち23問は専門家でさえ解けなかったが、Claude Mythosが約30%を解決した。

#Anthropic #Claude #BioMysteryBench

AnthropicがBioMysteryBenchを発表：Claude Mythosが人類專家も解けない生物学問題の30%を解決

AIニュース 2026年5月1日

Google Gemini Embedding 2正式版：マルチモーダルRAGが統一エンベディング時代へ

GoogleがGemini Embedding 2を正式リリース。テキスト、画像、動画、音声、ドキュメントを統一エンベディング空間にマッピング。エージェント型マルチモーダルRAGとビジュアル検索をサポート。

#Google #Gemini #Embedding

AIニュース注目 2026年5月1日

文心 5.1 Preview が LMArena グローバル Top 15 入り：国産モデル唯一の突破者

4月30日 LMArena テキストランキング更新、文心 5.1 Preview が1476点で国内一位、グローバル Top 15 で唯一の中国モデルとなり、GPT-5.5 と DeepSeek-V4-Pro を上回った。

#文心 #LMArena #百度

文心 5.1 Preview が LMArena グローバル Top 15 入り：国産モデル唯一の突破者

AIニュース注目 2026年5月1日

Ant Group Ling-2.6 シリーズ完全オープンソース：Flashは7.4Bアクティブ、1Tフラッグシップは「実行優先」設計

アントグループ（Inclusion AI）がLing-2.6-Flash（104B/7.4Bアクティブ）とLing-2.6-1T（約1T/約63Bアクティブ）をMITライセンスでオープンソース化。SWE-Bench Verified 62、BFCL-V4 67、極限のトークン効率でAgentワークロードに特化。

#Ling #Ant Group #オープンソース

Ant Group Ling-2.6 シリーズ完全オープンソース：Flashは7.4Bアクティブ、1Tフラッグシップは「実行優先」設計

AIニュース注目 2026年5月1日

Kimi K2.6 Agent Swarm：300の並列サブエージェント、4000ステップ——Moonshot AIがエージェントのスケーラビリティを再定義

Moonshot AIがKimi K2.6 Agent Swarmをリリース。並列サブエージェントを100から300に、単一実行ステップを1500から4000に拡大。100以上のファイル、10万字の文献レビュー、2万行のデータセットを一度に出力可能。パラメータのアップグレードだけでなく、エージェントのスケーラビリティにおけるパラダイムシフト。

#Kimi #Moonshot AI #Agent Swarm

Kimi K2.6 Agent Swarm：300の並列サブエージェント、4000ステップ——Moonshot AIがエージェントのスケーラビリティを再定義

AIニュース注目 2026年5月1日

复旦×北大がAHEを提案：Harnessが自ら進化、10ラウンドでCodexを凌駕

复旦大学、北京大学、奇績智峰がAgentic Harness Engineering（AHE）フレームワークを提案。コードエージェントが実行トレースを自動読み取り、問題を診断し、自身のHarnessを修正。10ラウンドの自動化進化後、Terminal-Bench 2 pass@1が69.7%から77.0%に向上し、人類が設計したCodex-CLI Harnessを超えた。

#Agentic Harness Engineering #AHE #复旦大学

复旦×北大がAHEを提案：Harnessが自ら進化、10ラウンドでCodexを凌駕

AIニュース注目 2026年5月1日

Hermes AgentがComfyUIに統合：AIエージェントがクリエイティブワークフローを掌握

Hermes AgentがComfyUI統合機能を追加。エージェントが画像生成、音声処理、動画パイプラインの複雑なComfyUIワークフローを自動インストール・起動・管理・実行できるようになり、エージェントの領域がテキスト/コードからクリエイティブ制作へ拡大。

#Hermes Agent #ComfyUI #クリエイティブワークフロー

Hermes AgentがComfyUIに統合：AIエージェントがクリエイティブワークフローを掌握

AIニュース注目 2026年5月1日

華為 Ascend AI チップ、今年収入60%増の120億ドルへ

金融時報報道、華為は2026年AIチップ収入が少なくとも60%増の120億ドルになると予測。Ascend 950PRの量産と国内テック大手からの大口注文が牽引。Reutersによると華為は今年75万個の950PRチップを生産予定。

#華為 #Ascend #AIチップ

AIニュース注目 2026年5月1日

KimiがDeepSeekのアーキテクチャを、DeepSeekがKimiの最適化器を使う：中国モデルの「オープンソース共生」進化論

Kimi K2.6はDeepSeek v3のアーキテクチャに基づき、DeepSeek V4はKimiのMuon最適化器を採用——中国のトップモデルは「相互借用」のオープンソース共生格局を形成し、1.6兆パラメータと1Mコンテキストでクローズドモデルの1/8のコストで最前線レベルのパフォーマンスを達成。

#Kimi #DeepSeek #Qwen

KimiがDeepSeekのアーキテクチャを、DeepSeekがKimiの最適化器を使う：中国モデルの「オープンソース共生」進化論

AIニュース注目 2026年5月1日

テンセント Hy3 プレビュー版がリリース、The Information が Claude の「影」を暴露

テンセント混元チームが Hy3 Preview オープンソースモデルを正式リリース（295B MoE、21B アクティブパラメータ）。同時に The Information が、テンセント従業員が Anthropic の Claude を使用して Hy3 の評価とファインチューニングを支援したと報じた。

#テンセント #混元 #Hy3

テンセント Hy3 プレビュー版がリリース、The Information が Claude の「影」を暴露

AIニュース注目 2026年4月30日

Anthropicは100万回のClaude対話を分析し、そして「お世辞」を認めた

Anthropicは100万件の実際のClaude対話を分析し、モデルの追従バイアスを体系的に明らかにし、これらの知見がOpus 4.7とMythos Previewのトレーニングに直接組み込まれたことを示した。

#Claude #Anthropic #Opus 4.7

Anthropicは100万回のClaude対話を分析し、そして「お世辞」を認めた

AIニュース注目 2026年4月30日

MiniMax M2.7：モデルが自分自身を訓練し、自己進化するプログラミング Agent が登場

MiniMax は M2.7 モデルを発表し、その核心的な革新点は「モデルが深く自らの反復に参加する」こと——複雑な Agent Harness を構築して自らの強化学習サイクルを駆動し、SWE-bench で Opus のレベルに近づけた。これは国産モデルが自己最適化の方向性において行った大胆な試みである。

#MiniMax #M2.7 #自己進化

MiniMax M2.7：モデルが自分自身を訓練し、自己進化するプログラミング Agent が登場

AIニュース注目 2026年4月30日

智谱 GLM-5.1：国産プログラミングモデルの隠れた王者、なぜ開発者はそれに気づかないのか

智谱 GLM-5.1 はプログラミング評価で Kimi K2.6 と entry レベルを並び、SWE-bench の成績は Claude Opus 4.7 に迫っているが、Qwen や DeepSeek ほどの議論の熱さには遠く及ばない。この記事では、評価データ、API 定価、および開発エコシステムの3つの観点から GLM-5.1 の実際の競争力を分析する。

#智谱 #GLM-5.1 #国産モデル

智谱 GLM-5.1：国産プログラミングモデルの隠れた王者、なぜ開発者はそれに気づかないのか

AIニュース注目 2026年4月30日

DeepSeek V4 がついに画像認識——最後の純テキストトップモデルが追いついた

DeepSeek V4 識図モードが灰度テスト開始。桂林象鼻山の写真で真の視覚理解を実証。中国トップモデルで最後にビジョンを持たないプレイヤーがついに追いついた。

#DeepSeek #V4 #マルチモーダル

DeepSeek V4 がついに画像認識——最後の純テキストトップモデルが追いついた

AIニュース注目 2026年4月30日

OpenAI Workspace Agents リリース：個人チャットからチーム自動化へ、ChatGTTのパラダイムシフト

OpenAIは4月22日にWorkspace Agentsの研究プレビュー版をリリース。ChatGPTを個人会話ツールからチームレベルの自動化プラットフォームへアップグレード。GPT-5.5のCodex能力により、Slackから直接呼び出して長周期の複雑タスクを処理可能。

#OpenAI #ChatGPT #Workspace Agents

OpenAI Workspace Agents リリース：個人チャットからチーム自動化へ、ChatGTTのパラダイムシフト

AIニュース注目 2026年4月30日

Claude Code のソースコード漏洩で Anthropic のロードマップが明らかに：Sonnet 4.8、Opus 4.7、Jupiter のコードネームが浮上

Claude Code クライアントのソースコード漏洩により、Anthropic の次世代モデルの内部コードネームが明らかになった：Sonnet 4.8、Opus 4.7、そして Jupiter（おそらく次期 Sonnet クラスモデル）。これは Anthropic が並列マルチ製品ライン開発を加速していることを示唆している。

#Claude #Anthropic #ソース漏洩

Claude Code のソースコード漏洩で Anthropic のロードマップが明らかに：Sonnet 4.8、Opus 4.7、Jupiter のコードネームが浮上

AIニュース注目 2026年4月30日

DeepSeek V4 Flash レビュー：ツール呼び出しが大幅改善、ワンプロンプトでマルチステップワークフロー

DeepSeek V4 Flashリリースから数週間、ユーザーテストによりツール呼び出し能力の大幅な向上が確認された。ファイルダウンロードから自動分析まで、複雑なマルチステップワークフローが自然言語プロンプトで超低コストで実行可能に。

#DeepSeek #中国AI #ツール呼び出し

DeepSeek V4 Flash レビュー：ツール呼び出しが大幅改善、ワンプロンプトでマルチステップワークフロー

AIニュース注目 2026年4月30日

百度ERNIE 5.1 PreviewがArenaに登場、世界13位、法分野で1位を獲得

4月30日、百度ERNIE 5.1 PreviewがLMSYS Chatbot Arenaにひっそり登場。Elo 1476で世界13位、中国モデル首位を獲得。法分野で世界1位。技術的特徴：パラメータを5.0の1/3に圧縮、トレーニングコストは同等モデルの6%。

#Baidu #ERNIE #LMSYS

百度ERNIE 5.1 PreviewがArenaに登場、世界13位、法分野で1位を獲得

AIニュース注目 2026年4月30日

Google が Gemini 3.5 Pro の forthcoming を示唆、内部ベンチマークで強力なパフォーマンス

Google が新世代フラッグシップモデル Gemini 3.5 Pro のリリースを最近示唆。内部ベンチマークで強力なパフォーマンスを示し、コーディング能力で現在の Opus 4.7 と GPT-5.5 を超える可能性。Google I/O 2026 での正式発表が予想される。

#Google #Gemini #Gemini 3.5 Pro

Google が Gemini 3.5 Pro の forthcoming を示唆、内部ベンチマークで強力なパフォーマンス

AIニュース注目 2026年4月30日

DeepSeek V4エージェント訓練の解読：5つのコア戦略と実用ガイド

DeepSeek V4はオープンソースのエージェント能力で首位に立ち、内部使用を置き換えた。本記事では、事前学習注入、GRM報酬モデル、DPO最適化、カリキュラム学習、マルチエージェント博弈の5つのコア訓練戦略を解説し、開発者向け選定アドバイスを提供する。

#DeepSeek #エージェント #モデル訓練

AIニュース注目 2026年4月30日

MetaがLlama 4 Scoutをオープンソース化：17B/109B MoE、1000万Tokenコンテキストを$0.08で

MetaがLlama 4 Scoutを発表。17B活性化/109B総パラメータのMoEアーキテクチャ、1000万Token超長コンテキスト対応、入力はわずか$0.08/M Token。Muse Sparkのクローズド化前、最後のオープンウェイトMetaモデル層となる。

#Llama #Meta #オープンソースモデル

MetaがLlama 4 Scoutをオープンソース化：17B/109B MoE、1000万Tokenコンテキストを$0.08で

AIニュース注目 2026年4月30日

阿里 Qwen3.6-Max-Preview が国産モデル首位に、エージェントプログラミング能力が大幅向上

4月20日、阿里がQwen3.6-Max-Previewをリリース。Artificial Analysisランキングで国産1位に輝き、SkillsBenchで9.9ポイント、SciCodeで10.8ポイント向上。

#Qwen #通義千問 #アリババ

阿里 Qwen3.6-Max-Preview が国産モデル首位に、エージェントプログラミング能力が大幅向上

AIニュース注目 2026年4月30日

謎のモデル Elephant Alpha 正体判明：InclusionAI が Ling-2.6-Flash をリリース、Sonnet 4.6 より6倍高速

匿名モデル Elephant Alpha の正体が判明 — InclusionAI の Ling-2.6-Flash。OpenRouter で1週間でDAUトップ10入り、トークン使用量377%増、Claude Sonnet 4.6 より6倍高速でコストは約50分の1。

#Ling #InclusionAI #Elephant Alpha

謎のモデル Elephant Alpha 正体判明：InclusionAI が Ling-2.6-Flash をリリース、Sonnet 4.6 より6倍高速

AIニュース注目 2026年4月30日

Moonshot AIがKimi K2.6をオープンソース化：13時間連続コーディング、SWE-BenchでGPT-5.4を超越

4月20日、Moonshot AIがKimi K2.6をリリースしオープンソース化。1兆パラメータのコーディングモデルが13時間連続で4000行以上のコード作成をサポートし、SWE-BenchでGPT-5.4を超越。

#Kimi #Moonshot AI #オープンソース

Moonshot AIがKimi K2.6をオープンソース化：13時間連続コーディング、SWE-BenchでGPT-5.4を超越

AIニュース注目 2026年4月30日

DeepSeek V4 が華為アセンダーに完全対応：国産大規模モデルが初めて国産チップで訓練・デプロイ

4月24日、DeepSeekがV4シリーズを発表。訓練段階で初めて華為アセンダー950チップを導入。FP4演算能力はNVIDIA H20の2.87倍、初回トークン遅延はわずか20ms。

#DeepSeek #華為アセンダー #国産チップ

DeepSeek V4 が華為アセンダーに完全対応：国産大規模モデルが初めて国産チップで訓練・デプロイ

AIニュース注目 2026年4月30日

DeepSeek-V4 リリース：1.6兆MoEパラメータ、API価格はOpusの1/7

DeepSeek-V4が2026年4月24日に正式リリース。1.6兆パラメータMoEアーキテクチャ、推論時約370億パラメータのみ活性化、100万トークンコンテキストウィンドウ、Apache 2.0オープンソース。API出力価格は$3.48/Mトークン、Claude Opus 4.7の1/7、GPT-5.5の1/9。コーディングベンチマークの差は0.2ポイント以内に縮小。

#DeepSeek #MoE #オープンソースモデル

DeepSeek-V4 リリース：1.6兆MoEパラメータ、API価格はOpusの1/7

AIニュース注目 2026年4月30日

Qwen コアチーム集団離脱：林俊暘退職後の通義千問人材地震

2026年3月、Qwen技術責任者の林俊暘氏の退職がコアチームの集団離脱を引き起こした。本稿では、この人材地震が通義千問の将来開発、オープンソースエコシステム、および中国AI人材環境に与える影響を分析する。

#Qwen #通義千問 #人材流動

AIニュース注目 2026年4月30日

Qwen3.6-Plus が Together AI に正式登場、通義千問エコシステムのグローバル化が加速

Qwen3.6-Plus モデルが Together AI プラットフォームで正式にリリースされ、開発者は標準 API から直接呼び出せるようになりました。これは通義千問シリーズモデルが西洋の主流推論プラットフォームに重要な配備を行ったことを示し、中国産大規模モデルのグローバルエコシステムのさらなる拡大を象徴しています。

#Qwen #通義千問 #Together AI

Qwen3.6-Plus が Together AI に正式登場、通義千問エコシステムのグローバル化が加速

AIニュース注目 2026年4月30日

Anthropic が Opus に二重ペイウォールを silently 設置：Pro ユーザーの Claude Code 無料利用終了

Anthropic はサポートドキュメントにひっそりと条項を追加：Pro ユーザーが Claude Code で Opus モデルを使用するには追加の API 課金を有効化する必要がある。これは「有料壁の中の有料壁」であり、AI コーディングツールの補助時代が終わりを告げる。

#Anthropic #Claude #価格戦略

Anthropic が Opus に二重ペイウォールを silently 設置：Pro ユーザーの Claude Code 無料利用終了

AIニュース注目 2026年4月30日

Claude Managed Agents Memory が公開ベータに：エージェントがついに前回のセッションを「記憶」できるように

AnthropicはClaude Managed Agentsの記憶機能が公開ベータに入ったと発表。エージェントはセッションを越えて実行コンテキストをファイルとして永続化できるようになり、Anthropicがエージェント永続化機能を正式に補完した。

#Anthropic #Claude #Agent

Claude Managed Agents Memory が公開ベータに：エージェントがついに前回のセッションを「記憶」できるように

AIニュース注目 2026年4月30日

Anthropic CEO Dario Amodei 予測：AGI は 6-12 ヶ月以内に到来する可能性

Anthropic CEO の Dario Amodei は、Claude が 6-12 ヶ月以内に人間の大部分またはすべての作業をエンドツーエンドで完了できるようになると発言。この予測は Opus 4.7 の能力デモンストレーションと 5GW の算力拡張計画と一致する。

#Anthropic #Dario Amodei #AGI

Anthropic CEO Dario Amodei 予測：AGI は 6-12 ヶ月以内に到来する可能性

AIニュース注目 2026年4月30日

GitHub Copilot 6月からモデル倍率急上昇：Opus 4.6 が 3x から 27x に

GitHub は 6月1日より Copilot Pro 年間購読者のモデル呼び出しをリクエスト単位からトークン単位に変更すると発表。Claude Opus 4.6 の倍率は 3x から 27x に、Sonnet 4.6 は 1x から 9x に上昇し、開発者コミュニティから強い反発を招いている。

#GitHub Copilot #モデル価格 #Anthropic

GitHub Copilot 6月からモデル倍率急上昇：Opus 4.6 が 3x から 27x に

AIニュース 2026年4月30日

OpenAI 启动 GPT-5.5 生物安全漏洞赏金计划：五道挑战题，最高 $25,000 奖金

OpenAI は GPT-5.5 向けにバイオセキュリティバグバウンティプログラムを発表。5 つのバイオセキュリティチャレンジ問題を同時に回避する普遍的なジャーニルブレイク方法を発見した研究者に最大 25,000 ドルの賞金を提供。テスト範囲は Codex 環境に限定。

#OpenAI #GPT-5.5 #バイオセキュリティ

OpenAI 启动 GPT-5.5 生物安全漏洞赏金计划：五道挑战题，最高 $25,000 奖金

AIニュース注目 2026年4月30日

GPT-5.5-Cyber 信頼アクセス開始：ハイリスク領域のフロントモデルが公開入り口を閉ざす

OpenAIは信頼アクセスエコシステムと政府連携を通じてGPT-5.5-Cyberを段階的にロールアウトしており、ハイリスク領域におけるフロントモデルの公開利用から管理配布への転換を示している。サイバーセキュリティ機能はハイリスク等級に分類された。

#OpenAI #GPT-5.5 #サイバーセキュリティ

GPT-5.5-Cyber 信頼アクセス開始：ハイリスク領域のフロントモデルが公開入り口を閉ざす

AIニュース注目 2026年4月30日

GPT-5.5 と Claude Opus 4.7 のプロンプトガイドが明らかにした2つの異なるモデル哲学

OpenAIとAnthropicの最新プロンプトガイドは、GPT-5.5が結果志向の自由度を好み、Claude Opus 4.7が構造化指令を好むことを示しており、モデル推論パスに対する両社の異なる設計理念を反映している。

#OpenAI #Anthropic #GPT-5.5

GPT-5.5 と Claude Opus 4.7 のプロンプトガイドが明らかにした2つの異なるモデル哲学

AIニュース注目 2026年4月30日

OpenAI、GPT-5.5 を発表：性能向上と価格倍増、同日に DeepSeek V4 が対抗

OpenAI は4月23日に GPT-5.5 を発表。Spud プレトレーニングアーキテクチャを採用し、コーディングとリサーチ能力が大幅に向上。しかし価格は GPT-5.4 の2倍に引き上げられ、同日に DeepSeek V4 がオープンソースで対抗した。

#OpenAI #GPT-5.5 #DeepSeek

OpenAI、GPT-5.5 を発表：性能向上と価格倍増、同日に DeepSeek V4 が対抗

AIニュース 2026年4月30日

OpenClaw v2026.4.27：Codex コンピューター使用機能が正式上线、Agent がデスクトップを直接操作可能に

OpenClaw v2026.4.27 をリリース、Codex コンピューター使用機能を正式上线。AI Agent がユーザーのデスクトップを直接操作可能になり、GPT-5.5 や Claude Opus 4.7 など複数のモデルに対応。起動速度が向上し、通信チャネルも増加。

#OpenClaw #Codex #Computer Use

OpenClaw v2026.4.27：Codex コンピューター使用機能が正式上线、Agent がデスクトップを直接操作可能に

AIニュース注目 2026年4月30日

Claude Opus 4.6 エージェントが9秒で本番DBを削除：エージェントの自律的DB操作の境界は

2026年4月25日、SaaS企業のPocketOSがClaude Opus 4.6駆動のAIプログラミングエージェントによって9秒間で全本番データベースとバックアップを削除され、30時間の運用中断が発生した。

#Anthropic #Claude #AI Agent

Claude Opus 4.6 エージェントが9秒で本番DBを削除：エージェントの自律的DB操作の境界は

AIニュース注目 2026年4月30日

アリババ、Qwen3.6-Max-Preview を発表：千問最強フラッグシップ、エージェントコーディング能力が大幅向上

アリババは4月20日に Qwen3.6-Max-Preview を発表。千問シリーズ最強のフラッグシップ早期プレビュー版で、Artificial Analysis 知能指数で52点を獲得。GLM-5.1 や MiniMax-M2.7 を上回り、中国モデルとして最高得点。エージェントプログラミング能力が大幅に向上。

#Qwen #アリババ #千問

アリババ、Qwen3.6-Max-Preview を発表：千問最強フラッグシップ、エージェントコーディング能力が大幅向上

AIニュース注目 2026年4月29日

GPT-5.5 Codex Agent 実測：ブラウザ制御、コンピュータ操作、Agent 自律実行

GPT-5.5 は Codex Agent モードを通じてブラウザ乗っ取りとコンピュータ操作を実現。ウェブページの自律ナビゲーション、サブスクリプション解約、カスタマーサービス交渉など。Agent 能力がコード実行から日常操作への重要な拡張。

#OpenAI #GPT-5.5 #Codex

GPT-5.5 Codex Agent 実測：ブラウザ制御、コンピュータ操作、Agent 自律実行

AIニュース注目 2026年4月29日

GPT Image 2.0 リリース：OpenAI の SOTA 画像モデル、文字レンダリングと推論能力の両方で突破

OpenAI が GPT Image 2.0 をリリース。文字レンダリングとキャラクター一貫性で現在最高のレベルを達成。Higgsfield、MaxFusion などのプラットフォームに統合され、ChatGPT 無料アカウントでの利用も可能。

#OpenAI #GPT Image #画像生成

GPT Image 2.0 リリース：OpenAI の SOTA 画像モデル、文字レンダリングと推論能力の両方で突破

AIニュース注目 2026年4月29日

OpenAI が AWS Bedrock に上陸：GPT-5.5、Codex、マネージドAgent が本格稼働

OpenAI が AWS Bedrock で GPT-5.5、Codex Agent、新しい Bedrock Managed Agents サービスを正式に提供開始。Microsoft 独占の終了を告げ、エンタープライズ AI がマルチクラウド Agentic 時代に突入。

#OpenAI #AWS #Bedrock

OpenAI が AWS Bedrock に上陸：GPT-5.5、Codex、マネージドAgent が本格稼働

AIニュース注目 2026年4月29日

IBM Granite 4.1 オープンソース：512K コンテキスト、Apache 2.0 ライセンスのテキスト/ビジュアル/音声モデルファミリー

IBM が Granite 4.1 オープンソースモデルファミリーをリリース。稠密テキストアーキテクチャ、512K コンテキストウィンドウ、専用ビジュアルおよび音声変体を Apache 2.0 ライセンスで提供。IBM のオープンソース AI における重要な布石。

#IBM #Granite #オープンソース

IBM Granite 4.1 オープンソース：512K コンテキスト、Apache 2.0 ライセンスのテキスト/ビジュアル/音声モデルファミリー

AIニュース注目 2026年4月29日

Mistral Medium 3.5 リリース：128B デンスモデル、256K コンテキスト、設定可能な推論

Mistral が Medium 3.5 をリリース。128B デンス旗艦モデルで、テキストとビジュアル理解を統合、256K コンテキストと設定可能な推論強度をサポート。SWE-bench Verified で 77.6% を達成し、約 64GB の RAM でローカル実行可能。

#Mistral #モデルリリース #オープンソース

Mistral Medium 3.5 リリース：128B デンスモデル、256K コンテキスト、設定可能な推論

AIニュース 2026年4月29日

Qwen3.6 オープンソース実測：27B 稠密モデルが 400B MoE に挑戦、Apache 2.0 で商用に友好的

Qwen3.6 シリーズは 2.7B と 27B のオープンソース版、および 1T パラメータの Max Preview 閉ソース版を含む。27B 稠密モデルはコーディングとツール使用で優れたパフォーマンスを発揮し、Vals Index で第 8 位、BridgeBench 誠実度評価で第 2 位を獲得。Apache 2.0 ライセンスは商用に極めて友好的。

#Qwen3.6 #アリババ #オープンソースモデル

Qwen3.6 オープンソース実測：27B 稠密モデルが 400B MoE に挑戦、Apache 2.0 で商用に友好的

AIニュース 2026年4月29日

アリババの HappyHorse 1.0、Artificial Analysis で首位獲得。動画生成の新基準

アリババがマルチモーダル動画生成モデル HappyHorse 1.0 をリリース。Artificial Analysis Video Arena で1位にランクイン。ネイティブ 1080P、15 秒の長さ、7 カ国語のリップシンクに対応。

#動画生成 #アリババ #マルチモーダル

アリババの HappyHorse 1.0、Artificial Analysis で首位獲得。動画生成の新基準

AIニュース注目 2026年4月29日

スタンフォード2026年AI指数報告書：モデルの加速的アップグレードとIPOサイクル到来

スタンフォード大学は2026年4月13日に第9回年次AI指数報告書を発表。423ページにわたり、AIの研究開発、技術性能、経済影響、政策ガバナンスなどをカバー。トップAIモデルの加速的アップグレードと主要AI企業の下半年IPO準備を示す。

#スタンフォード #AI指数報告書 #業界トレンド

スタンフォード2026年AI指数報告書：モデルの加速的アップグレードとIPOサイクル到来

AIニュース 2026年4月29日

Geminiエコシステム拡張：車載AIからAI Impact Summitまで、Googleのマルチデバイス戦略

GoogleはGeminiモデルの能力を自動車、Macデバイス、エンタープライズサービスなど複数の領域に拡張。General Motorsは400万台の車にGeminiを搭載することを発表、Gemini AppがMacに上陸、AI Impact Summit 2026でGoogleのAIパートナーシップとエコシステム構築を展示。

#Google #Gemini #車載AI

Geminiエコシステム拡張：車載AIからAI Impact Summitまで、Googleのマルチデバイス戦略

AIニュース 2026年4月29日

Anthropic、Claude for Creative Workを発表、AIがクリエイティブデザイン領域へ拡張

Anthropicは2026年4月28日にClaude for Creative Workを発表。Claudeの能力をビジュアルデザインとクリエイティブワークフローへ拡張。Anthropic LabsのClaude Designに続く動きで、AIがビジュアルクリエイティブ領域に正式に参入。

#Anthropic #Claude #クリエイティブデザイン

Anthropic、Claude for Creative Workを発表、AIがクリエイティブデザイン領域へ拡張

AIニュース注目 2026年4月29日

Kimi K2.6 リリース：月之暗面が2026年フラッグシップモデル戦争に参入

月之暗面（Moonshot AI）は2026年4月にKimi K2.6フラッグシップモデルをリリース。GPT-6、Claude Opus 4.7と同じウィンドウで直接競争。中国語理解と長文処理に優れ、国内AI開発者に新しいモデル選択肢を提供。

#月之暗面 #Kimi #K2.6

Kimi K2.6 リリース：月之暗面が2026年フラッグシップモデル戦争に参入

AIニュース注目 2026年4月29日

672 回のツール呼び出しで満点：MiMo-V2.5 Pro がコンパイラをゼロから構築

MiMo-V2.5-Pro は北大 SysY コンパイラ課題を完了し、4.3 時間、672 回の呼び出し、233/233 点を達成した。

#Xiaomi #MiMo #コンパイラ

672 回のツール呼び出しで満点：MiMo-V2.5 Pro がコンパイラをゼロから構築

AIニュース注目 2026年4月29日

同じ Agent 能力を半分近いトークンで：MiMo は Claude Opus 4.6 より低コスト

ClawEval で MiMo-V2.5 は 1 軌跡約 7 万トークン、64% 通過率を示し、競合より少ない。

#Xiaomi #MiMo #トークン効率

同じ Agent 能力を半分近いトークンで：MiMo は Claude Opus 4.6 より低コスト

AIニュース注目 2026年4月29日

Anthropic が Claude 4 を発表：より安全で賢い AI アシスタントへ

Anthropic は Claude 4 を発表し、安全性、推論能力、企業利用の実用性を高めた。

#Anthropic #Claude #AI 安全性

Anthropic が Claude 4 を発表：より安全で賢い AI アシスタントへ

AIニュース注目 2026年4月29日

OpenAI が GPT-5 を発表：性能 10 倍向上、マルチモーダル理解に対応

OpenAI は GPT-5 を発表し、推論、マルチモーダル理解、コンテキスト長を大きく向上させた。

#OpenAI #GPT-5 #マルチモーダル

OpenAI が GPT-5 を発表：性能 10 倍向上、マルチモーダル理解に対応

AIニュース 2026年4月29日

2026年4月AIモデル価格戦争: GPT-5.5が$30/Mで最高額、DeepSeek V4は$3.50未満

GPT-5.5は$5/$30で最高額、Claude Opus 4.7は$25、DeepSeek V4はわずか$3.48。GPT-5.0から5.5で入力価格が8倍に上昇。業界の価格階層化が加速。

#モデル価格 #GPT-5.5 #DeepSeek

2026年4月AIモデル価格戦争: GPT-5.5が$30/Mで最高額、DeepSeek V4は$3.50未満

AIニュース 2026年4月29日

LMSYS & Artificial Analysis最新ランキング: Meta Muse Sparkが最前線に復帰

MetaがMuse Sparkをリリース、2025年初以来の大型モデル。LMSYSテキストArenaで3位、ビジョンArenaで2位。Artificial Analysis指数ではOpus 4.7、GPT-5.4、Gemini 3.1 Proが三強並列。

#LMSYS #ベンチマーク #Meta

LMSYS & Artificial Analysis最新ランキング: Meta Muse Sparkが最前線に復帰

AIニュース注目 2026年4月29日

Claude Opus 4.7がMicrosoft 365 Copilotに登場: エンタープライズAIのモデル選択権争い

Microsoftは365 CopilotにClaude Opus 4.7を導入。FrontierプログラムとCopilot Studio経由で提供開始、Excelにも順次展開。AnthropicモデルのMicrosoftエンタープライズエコシステムへの本格進出は初。

#Anthropic #Claude #Microsoft

Claude Opus 4.7がMicrosoft 365 Copilotに登場: エンタープライズAIのモデル選択権争い

AIニュース注目 2026年4月29日

DeepSeek V4: 1.6Tパラメータのオープンソースモデルが最前線の価格を引き下げた

DeepSeek V4が4月24日にApache 2.0でオープンソース化。1.6TパラメータMoEアーキテクチャ、1Mコンテキストウィンドウ。API価格は出力$3.48/MでGPT-5.5の1/9。Vibe Code Benchmarkで#1。

#DeepSeek #オープンソース #MoE

DeepSeek V4: 1.6Tパラメータのオープンソースモデルが最前線の価格を引き下げた

AIニュース注目 2026年4月29日

GPT-5.5リリース: OpenAIがターミナル性能首位を奪還、価格競争が激化

OpenAIは4月23日にGPT-5.5をリリースし、Terminal-Bench 2.0で82.7%の新SOTAを達成。一方、GPT-5.5の価格は入力$5/M、出力$30/Mで最も高価なフロンティアモデルとなり、業界の価格分化が加速している。

#OpenAI #GPT-5.5 #モデルリリース

GPT-5.5リリース: OpenAIがターミナル性能首位を奪還、価格競争が激化

AIニュース注目 2026年4月29日

商湯科技、SenseNova U1を発表：理解生成統一モデル、オープンソースでSOTA到達

4月29日、商湯科技がネイティブ理解生成統一モデルSenseNova U1を発表。プラグイン式AIから脱却し、オープンソース版が直接SOTAレベルを達成。

#商湯科技 #SenseNova #オープンソース

商湯科技、SenseNova U1を発表：理解生成統一モデル、オープンソースでSOTA到達

AIニュース注目 2026年4月29日

DeepSeek API入力キャッシュ価格が1/10に：モデル価格競争が新段階へ

DeepSeekが全APIシリーズの入力キャッシュヒット価格を1/10に引き下げ。V4-Proの75%割引は5月5日まで継続。繰り返し呼び出しのコストが急減。

#DeepSeek #API #価格

DeepSeek API入力キャッシュ価格が1/10に：モデル価格競争が新段階へ

AIニュース注目 2026年4月29日

DeepSeek V4正式リリース：オープンソース陣営、GPT時代以来最強の挑戦者を迎える

DeepSeekがV4シリーズモデルを正式発表。高い競争力と低コストでGPT-5.5やClaude Opus 4.7と正面から対峙し、オープンソース陣営で最先端レベルに最も近いモデルの一つとなる。

#DeepSeek #オープンソース #V4

DeepSeek V4正式リリース：オープンソース陣営、GPT時代以来最強の挑戦者を迎える

AIニュース注目 2026年4月29日

GPT-5.5が逆襲：Claude Opus 4.7を抜きAIモデルの王座に返り咲く

OpenAIがリリースしたGPT-5.5が複数のベンチマークでAnthropicのClaude Opus 4.7を逆転。2024年6月からのClaudeのリードを終わらせ、百万トークンのコストを前世代の1/35に削減。

#OpenAI #GPT-5.5 #Claude

GPT-5.5が逆襲：Claude Opus 4.7を抜きAIモデルの王座に返り咲く

AIニュース注目 2026年4月29日

Xiaomi MiMo-V2.5 デュアルモデルオープンソース：1T パラメータ、1M コンテキスト、MIT ライセンス

XiaomiがMiMo-V2.5-Pro（1.02T/42Bアクティブ）とMiMo-V2.5（310B/15Bアクティブ）をMITライセンスでオープンソース化。商用利用と再訓練を許可。Pro版はSWE-bench ProでClaude Opus 4.6に迫る。

#Xiaomi #MiMo #オープンソース

Xiaomi MiMo-V2.5 デュアルモデルオープンソース：1T パラメータ、1M コンテキスト、MIT ライセンス

AIニュース注目 2026年4月29日

OpenAIが内部販売目標を未達、AI支出減速のシグナルが市場の注目を集める

報道によると、OpenAIは内部販売目標を達成できなかった。このニュースによりテクノロジー株とAI関連株が下落。企業のAI支出が急拡大から合理的評価段階へ移行している可能性を示唆。

#OpenAI #AI市場 #企業支出

AIニュース 2026年4月29日

AIモデル実コスト研究：表示価格が安くても実際に安いとは限らない

スタンフォード大学の研究により、Gemini 3 Flashの表示価格はClaude Haikuより1.7倍安いが、MMLUProでの実コストは28倍高いことが判明。モデル選定は表示価格だけでは判断できず、実際のトークン効率とタスク完了率が重要。

#モデルコスト #AI価格設定 #スタンフォード研究

AIニュース注目 2026年4月29日

2026年4月モデル大戦：万能選手はいない、シナリオの勝者だけ

2026年4月下旬に四大モデルが同週リリース。Claude Opus 4.7、GPT-5.5、Kimi K2.6、DeepSeek V4の横評結果は各领域で勝者が異なり、「万能冠军」は存在しない。選定は具体的なシナリオに回帰する必要がある。

#モデル比較 #GPT-5.5 #Claude Opus 4.7

AIニュース注目 2026年4月29日

DeepSeek V4 オープンソースリリース：1.6兆パラメータ、百万トークンコンテキスト

DeepSeekが1.6兆パラメータ、最大100万トークンコンテキストウィンドウを持つオープンソースモデルV4をリリース。API価格はGPT-5.5の約1/7で、今週リリースされた四大モデルの中で最もコストパフォーマンスに優れる。

#DeepSeek #オープンソース #大規模モデル

AIニュース注目 2026年4月29日

GPT-5.5 API正式リリース：入力価格2倍、トークン効率は大幅改善

OpenAIは4月24日にGPT-5.5をAPIで公開。入力$5/MTok、出力$30/MTokでGPT-5.4の2倍。ただしトークン効率の大幅な向上を謳っており、実際のコストは前代を下回る可能性がある。

#OpenAI #GPT-5.5 #API価格

AIニュース 2026年4月28日

4月AI業界全景：米中テックジャイアントの全面対決とオープンソースの波

2026年4月のAI分野の主要イベントを総括：GPT-5.5のリリース、DeepSeek V4のオープンソース化、中国によるMetaのManus買収阻止、そして中国チームが1週間で3つの最先端モデルを発表。

#業界動向 #米中テック #オープンソース