Gataが世界規模の実ユーザーChatGPT対話データセット「ChatGPT-RealUser-2.2M 」を公開
ChainCatcherの報道によると、分散型AIインフラ企業Gataは、世界規模の実ユーザーによるChatGPT対話データセット「ChatGPT-RealUser-2.2M」を発表しました。このデータセットは、GataのGPT-to-Earnプログラム(ユーザーの自発的参加)を通じて収集され、2024年から2025年にかけて合計224万件以上の実際の対話、約356万組のQ&Aが集められ、1.5万人以上の実ユーザーによるもので、GPT-3.5、GPT-4、o1とのインタラクションが含まれています。
説明によると、このデータセットはAllen Institute for AIの従来の同種データセットの約2倍の規模で、実際のシナリオや複数ターンの対話をカバーし、オンチェーンインセンティブメカニズムにより、多数の暗号資産関連のインタラクションも含まれています。プレビュー版はHugging Faceで公開されており、600件の対話サンプルが含まれています。完全なデータセットは研究および商用利用が可能です。
なお、2025年5月にGataは、YZi LabsやIDG Blockchainなどが参加した合計400万ドルのシードラウンド資金調達を完了したと発表しています。
免責事項:本記事の内容はあくまでも筆者の意見を反映したものであり、いかなる立場においても当プラットフォームを代表するものではありません。また、本記事は投資判断の参考となることを目的としたものではありません。
こちらもいかがですか?
ゴールドマン・サックス:FRBのタカ派は安心させられたが、今後の金融緩和は労働市場次第
米連邦準備制度理事会の金利決定後、来年1月に金利が据え置かれる確率は73.4%となった。
パウエル:債券購入規模は今後数ヶ月間高水準を維持する可能性がある
クリス・アンステイ:FRBは流動性逼迫に対応するために国債の購入を開始する予定
