Gataが世界規模の実ユーザーChatGPT対話データセット「ChatGPT-RealUser-2.2M」を公開

Chaincatcher2025/08/29 04:05

原文を表示

ChainCatcherの報道によると、分散型AIインフラ企業Gataは、世界規模の実ユーザーによるChatGPT対話データセット「ChatGPT-RealUser-2.2M」を発表しました。このデータセットは、GataのGPT-to-Earnプログラム（ユーザーの自発的参加）を通じて収集され、2024年から2025年にかけて合計224万件以上の実際の対話、約356万組のQ&Aが集められ、1.5万人以上の実ユーザーによるもので、GPT-3.5、GPT-4、o1とのインタラクションが含まれています。

説明によると、このデータセットはAllen Institute for AIの従来の同種データセットの約2倍の規模で、実際のシナリオや複数ターンの対話をカバーし、オンチェーンインセンティブメカニズムにより、多数の暗号資産関連のインタラクションも含まれています。プレビュー版はHugging Faceで公開されており、600件の対話サンプルが含まれています。完全なデータセットは研究および商用利用が可能です。

なお、2025年5月にGataは、YZi LabsやIDG Blockchainなどが参加した合計400万ドルのシードラウンド資金調達を完了したと発表しています。

免責事項：本記事の内容はあくまでも筆者の意見を反映したものであり、いかなる立場においても当プラットフォームを代表するものではありません。また、本記事は投資判断の参考となることを目的としたものではありません。

PoolX: 資産をロックして新しいトークンをゲット

最大12%のAPR！エアドロップを継続的に獲得しましょう！

今すぐロック