暗号資産を購入

支払い方法

USD

購入 & 売却

Visa、Mastercard、SEPAなどに対応

柔軟な取引、手数料ゼロ

暗号資産を使って世界中で支払いができます

基礎

暗号を自由に取引

証拠金取引

レバレッジを使って利益を拡大しましょう

即時スワップと自動投資

手数料ゼロ＆スリッページなしで、どんなサイズでも取引可能

レバレッジポジションを簡単に利用

上場前取引

上場前の新規トークンを取引

上級

Gateウォレットでオンチェーン取引を行う

新しいオンチェーントークンにスマートアクセス

自動取引によるスマート戦略

専門家の取引戦略をフォロー

プラットフォーム間で共有される 1 つの証拠金残高

数百の無期限先物にアクセス

世界の伝統資産を一つのプラットフォームで

オプション取引

ヨーロッパ式のバニラオプションで取引できます

資本効率の最大化

先物取引の紹介

先物取引の準備をする

先物イベント

イベントに参加して報酬を獲得

仮想資金を使ってリスクのない取引を体験しよう。

米国株CFDデリバティブ

高レバレッジ・24時間365日取引

トークン化株式

実際の株式資産に裏付けられています

米国債RWA利回り向けにGUSDをミント

ローンチパッド

キャンディーを集めてAirDropを獲得

クイックステーキング潜在的な新しいトークンを獲得しよう

GTを保有して、大量のAirDropを無料で入手

世界中の株式IPOにフルアクセス

Alphaポイント

オンチェーン資産を取引してAirdropを獲得

先物ポイント

先物ポイントを獲得し、Airdrop報酬を受け取りましょう。

投資

遊休トークンで利息を稼ぐ

定期的に自動投資

デュアル投資

市場のボラティリティから利益を得る

ソフトステーキング

フレキシブルステーキングで報酬を獲得します

暗号資産ローン

1つの暗号通貨を担保に別の暗号通貨を借りる

レンディングセンター

ワンストップレンディングハブ

VIPウェルスハブ

プレミアム資産成長プラン

プライベートウェルスマネジメント

プレミアム資産配分

クオンツ資金

トップレベルのクオンツ戦略

ステーキング

暗号をステーキングしてPoS製品で稼ぐ

スマートレバレッジ

清算なしレバレッジ

暗号資産の価値を発見しよう

暗号資産相場分析ライブ

暗号資産トレーダーと意見交換

暗号資産業界の最新情報

もっと

プロモーション

イベントセンター

アクティビティに参加して報酬を獲得

友達を招待して紹介報酬を獲得

アフィリエイトプログラム

限定コミッション報酬を獲得

影響力を高めてAirdropを獲得

アナウンスメント

プラットフォームのリアルタイム更新

暗号資産の洞察を得よう

VIPサービス

大幅な手数料割引

ワンストップ資産管理ソリューション

機関向けサービス

エンタープライズ向け資産ソリューション

開発者（API）

Gateアプリケーションエコシステムに接続する

OTC銀行送金

法定通貨の入金と出金

ブローカープログラム

豊富なAPIリベートメカニズム

AI

あなたの対話型AI万能パートナー

ソーシャルアプリで Gate AI をそのまま利用

Gateブルーロブスター、すぐに使える

Gate for AI Agent

AIインフラストラクチャ、Gate MCP、Skills、CLI

Gate Skills Hub

1万以上のスキル

オフィス業務から取引まで、AIをもっと活用できるワンストップスキルライブラリ

40以上のAIモデルをスマートに選択、追加料金0%

その他

ヘルプセンター

FAQ とヘルプガイドを見つける

暗号投資について学ぶ

パートナー

チャンピオンと共に成長

準備金証明

Gate は100%準備金証明を約束します

あなたの資産を安全に保護します

PerplexityがWeb検索エージェントのポストトレーニング手法を公開；Qwen3.5ベースのモデルが精度とコストでGPT-5.4を上回る

AIエージェント AI業界ニュース

2026-04-23 04:54:56

ニュース速報メッセージ：4月23日 — Perplexityの研究チームが、Web検索エージェント向けのポストトレーニング手法の詳細を説明する技術記事を公開しました。このアプローチは、2つのオープンソースのQwen3.5モデル (Qwen3.5-122B-A10B と Qwen3.5-397B-A17B) を使用し、2段階のパイプラインを採用します。すなわち、命令追従と言語の一貫性を確立するための教師あり微調整 (SFT) の後に、検索精度とツール使用の効率を最適化するためのオンライン強化学習 (RL) を行います。

RLフェーズでは、GRPOアルゴリズムを2つのデータソースとともに活用します。1つは、内部のシードクエリから構築された独自のマルチホップ検証可能な質問-回答データセットで、推論の2〜4ホップと、複数ソルバによる検証を必要とします。もう1つは、配備要件を客観的に検査可能な原子的条件へ変換してSFTの振る舞い劣化を防ぐ、ルーブリックに基づく汎用会話データです。

報酬設計では、ゲート付き集約を採用します——ベースラインの正しさが達成された場合にのみ、選好スコアが寄与します (question-answer match またはすべてのルーブリック基準が満たされた場合)。これにより、高い選好信号が事実誤りを覆い隠すことを防ぎます。効率ペナルティは同一グループ内のアンカーリングを用い、同じグループにおける正答のベースラインを超えて、ツール呼び出しや生成長に対してなめらかなペナルティを適用します。

評価では、Qwen3.5-397B-SFT-RLが検索ベンチマーク全体で業界最高水準の性能を達成しています。FRAMESでは、単一ツール呼び出しで57.3%の精度を実現し、GPT-5.4を5.7パーセントポイント上回ります。また、Claude Sonnet 4.6を4.7パーセントポイント上回ります。中程度の予算 (4回のツール呼び出し) では、1クエリあたり$0.02で73.9%の精度を達成し、GPT-5.4の1クエリあたり$0.085での67.8%の精度、Sonnet 4.6の1クエリあたり$0.153での62.4%の精度と比較しています。コスト数値は各提供元の公開API料金に基づき、キャッシュの最適化は除外されています。

ソースを表示

免責事項：本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。

関連ニュース

オーストラリア、Mythos AIのサイバーセキュリティリスクに対処するためAnthropicと協力

Google、学習用と推論用を分けたAIチップを発表し、性能を2.8倍に向上

OpenClaw、Hermes、SillyTavernがGLM Coding Planのサポート対象として確認

OpenAIが、PII検出とマスクのためのオープンソース・プライバシーフィルターモデルを公開

Yifan ZhangがDeepSeek V4の完全な技術仕様を開示：1.6Tパラメータ、6アクティベーション搭載の384人のエキスパート

詳細分析

マングローブ CISO 警告：ShinyHunters が Anthropic の社内システムを侵害したと主張

Market Whisper04-23 03:31

OpenAI が ChatGPT Workspace Agents を公開：Codex による駆動、チーム共有、Slack 連携

ChainNewsAbmedia04-23 02:55

GoogleはDeep Research Maxを推します：MCPをサポートし、企業の非公開データを扱える

ChainNewsAbmedia04-21 18:14

コメント

0/400

コメントなし