ゲートニュース 4月23日 — ByteDanceのSeedチームは、単一の画像からテクスチャ付きの3Dアセットを生成するテキストから3Dへのモデル「Seed3D 2.0」をリリースしました。アップグレードは幾何学的な精度と素材のリアリズムに重点が置かれており、APIは現在Volcano Arkで利用可能です。
幾何学的生成は、Coarse-to-Fineの2段階戦略を採用しています。まず大規模パラメータのDiTモデルが粗いレベルでのトポロジーを確立し、その後で鋭いエッジと細かなサーフェスを復元します。素材生成では、(Mixture of Experts)MoE(アーキテクチャを用いて高解像度のディテールを強化し、さらに未知の照明条件下で素材分解の安定性を高めるために、)VLM(Vision Language Model)の事前知識を取り込み、標準的なレンダリングパイプラインと互換性のある完全なPBRマップを出力します。
3Dモデリングの経験を持つ評価者60名が、約200のテストケースでブラインド比較を行い、Seed3D 2.0をHunyuan3D-2.5/3.1、Tripo 3.0、Rodin Gen2、HiTem v2.0、そして従来のSeed3D 1.0と比較しました。幾何学的生成の選好率は65.1%から98.3%の範囲でした。一方、テクスチャ付き3Dアセットの選好率は、すべての比較において69%を超えました。
下流のアプリケーション向けに、Seed3D 2.0は、共同情報を伴って3Dアセットを独立したコンポーネントに分解し、URDF形式でIsaac Simおよびその他のシミュレーションエンジンに対応した出力を提供します。ロボットによる把持のような動的な相互作用シナリオに適用できます。シーンのレベルでは、テキスト、マルチビューの画像、または動画入力に対応し、複数のアセットを組み合わせて完全なシーンを生成します。
免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、
免責事項をご確認ください。