Khoảnh khắc Darwin của AI: Khi các mô hình bắt đầu đấu tranh để sinh tồn
Trong tương lai, các mô hình mạnh mẽ và tác nhân thông minh sẽ ra đời trong một "môi trường phi tập trung".
Tiêu đề gốc: Trí tuệ nhân tạo Darwin—Đấu trường sinh tử AI
Tác giả gốc: 0xJeff, Nhà đầu tư AI
Người dịch gốc: Saoirse, Foresight News
Cạnh tranh là cốt lõi của quá trình tiến hóa loài người. Từ thời xa xưa, con người đã cạnh tranh để giành lấy: · Thức ăn và lãnh thổ · Vợ/Chồng/Bạn đồng hành · Địa vị trong bộ lạc hoặc xã hội · Liên minh và cơ hội hợp tác
Thợ săn săn mồi, chiến binh chiến đấu để sinh tồn, và các thủ lĩnh bộ lạc tranh giành lãnh thổ. Theo thời gian, những cá thể có đặc điểm vượt trội giúp sinh tồn cuối cùng sẽ sống sót, sinh sản và truyền gen của mình từ thế hệ này sang thế hệ khác.
Quá trình này được gọi là chọn lọc tự nhiên. Quá trình chọn lọc tự nhiên không bao giờ ngừng lại, các hình thức của nó liên tục phát triển: từ "cạnh tranh sinh tồn" đến "cạnh tranh giải trí" (chẳng hạn như các cuộc thi đấu võ sĩ giác đấu, Thế vận hội, các sự kiện thể thao và thể thao điện tử), và cuối cùng là "cạnh tranh thúc đẩy tiến hóa" (chẳng hạn như cạnh tranh trong công nghệ, truyền thông, phim ảnh và chính trị). Chọn lọc tự nhiên luôn là động lực cốt lõi của quá trình tiến hóa loài người, nhưng liệu sự tiến hóa của trí tuệ nhân tạo có đi theo cùng một logic này? Sự phát triển của trí tuệ nhân tạo không được quyết định bởi một phát minh duy nhất, mà là bởi vô số "cuộc cạnh tranh và thử nghiệm vô hình" - những cuộc cạnh tranh cuối cùng lựa chọn những mô hình tồn tại và loại bỏ những mô hình bị lãng quên. Trong bài viết này, chúng ta sẽ đi sâu vào những cuộc cạnh tranh vô hình này (bao gồm cả Web2 và Web3) và phân tích sự tiến hóa của trí tuệ nhân tạo từ góc độ cạnh tranh. Hãy cùng khám phá.
Từ năm 2023 đến năm 2025, lĩnh vực trí tuệ nhân tạo đã chứng kiến sự phát triển bùng nổ với sự ra đời của ChatGPT.
Nhưng ngay cả trước khi có ChatGPT, OpenAI đã tạo được dấu ấn trong trò chơi Dota 2 (với hệ thống "OpenAI Five"): bằng cách chơi hàng chục nghìn ván đấu với người chơi thông thường, người chơi chuyên nghiệp, và thậm chí là chính nó, nó đã chứng minh khả năng phát triển nhanh chóng, ngày càng mạnh mẽ hơn qua mỗi trận đấu.
Kết quả là một hệ thống thông minh phức tạp đã đánh bại đội tuyển vô địch thế giới Dota 2 năm 2019 một cách thuyết phục.
Một ví dụ nổi tiếng khác xảy ra vào năm 2016: AlphaGo đã đánh bại nhà vô địch cờ vây thế giới Lee Sedol. Điều đáng kinh ngạc nhất không phải là việc nó đã đánh bại nhà vô địch thế giới, mà là cách AlphaGo học hỏi. Việc huấn luyện AlphaGo không chỉ dựa vào dữ liệu của con người. Giống như OpenAI Five, nó phát triển thông qua việc tự chơi - một quá trình tuần hoàn: Mỗi thế hệ mô hình đều cạnh tranh với thế hệ trước; các biến thể mô hình hiệu suất tốt nhất tồn tại và "sinh sôi nảy nở" (tức là tối ưu hóa lặp đi lặp lại); các chiến lược yếu hơn bị loại bỏ. Nói cách khác, "AI Darwin" này đã nén một quá trình tiến hóa vốn thường mất hàng triệu năm thành chỉ vài giờ tính toán. "Chu kỳ tự cạnh tranh" này đã tạo ra những đột phá công nghệ chưa từng có trong lịch sử loài người. Ngày nay, chúng ta thấy những mô hình cạnh tranh tương tự trong các ứng dụng tài chính, mặc dù ở một hình thức khác. Tuần trước, Nof1 đã ra mắt Alpha Arena, một "cuộc chiến sống còn trong hợp đồng tiền điện tử vĩnh viễn" với sự tham gia của sáu mô hình AI (Claude, DeepSeek, Gemini, GPT, Qwen và Grok) để quản lý 10.000 đô la tiền quỹ. Mô hình nào có hiệu suất lãi lỗ (PnL) tốt nhất sẽ chiến thắng. "Alpha Arena chính thức ra mắt! Sáu mô hình AI, mỗi mô hình đầu tư 10.000 đô la và giao dịch hoàn toàn tự động. Tiền thật, thị trường thật, chuẩn mực thật - bạn ủng hộ mô hình nào?" Sự phổ biến nhanh chóng của cuộc thi không đến từ luật chơi mà từ tính minh bạch: thông thường, các chiến lược alpha (tức là chiến lược lợi nhuận vượt trội) được giữ bí mật tuyệt đối, nhưng trong cuộc thi này, chúng ta có thể chứng kiến AI nào mang lại lợi nhuận cao nhất theo thời gian thực. Hơn nữa, giao diện người dùng (UI/UX) hiển thị hiệu suất giao dịch trực tiếp cực kỳ tinh tế và tối ưu. Đội ngũ đang tận dụng những thông tin nóng hổi và hiểu biết thu được từ cuộc thi để phát triển mô hình và công cụ giao dịch của Nof1. Người dùng quan tâm có thể tham gia danh sách chờ để có cơ hội dùng thử các công cụ. Cách tiếp cận của Nof1 không phải là mới—các cuộc thi tài chính đã tồn tại từ lâu (đặc biệt là trong hệ sinh thái Bittensor và thị trường tiền điện tử nói chung), nhưng chưa có đội nào công khai và dễ tiếp cận như Nof1. Dưới đây là một số cuộc thi tiêu biểu nhất: Synth (Cuộc thi Synthesizer) (Logo: SN50, Host: @SynthdataCo) Trong cuộc thi này, các kỹ sư học máy triển khai các mô hình học máy để dự đoán giá và độ biến động của tài sản tiền điện tử, với phần thưởng là token Synth alpha SN50. Những dự đoán chất lượng cao này sau đó được sử dụng để tạo ra "dữ liệu giá tổng hợp" (và quỹ đạo giá) có độ chính xác cao.
“Kể từ đầu năm nay, chúng tôi đã trao hơn 2 triệu đô la cho các nhà khoa học dữ liệu và nhà phân tích định lượng hàng đầu tham gia cuộc thi.”
Nhóm nghiên cứu đang sử dụng các tín hiệu dự đoán này để giao dịch tiền điện tử trên nền tảng Polymarket: cho đến nay, họ đã đạt được tỷ suất hoàn vốn đầu tư (ROI) ròng là 184% với số vốn ban đầu là 3.000 đô la. Thách thức tiếp theo là mở rộng quy mô giao dịch trong khi vẫn duy trì mức hiệu suất hiện tại.

“Tiến trình giao dịch mới nhất của chúng tôi trên nền tảng Polymarket:
・Vốn gốc: 3.000 đô la
・Lợi nhuận: 5.521 đô la
・Tỷ lệ hoàn vốn đầu tư (ROI): 184%
・Tỷ suất lợi nhuận hàng năm (APY): 3.951%
Tất cả những điều này đều được hỗ trợ bởi mô hình dự đoán của Synth. Chúng ta sẽ thảo luận về Sự mới lạ của tuần này. Logic đằng sau điều này được trình bày chi tiết trong cột "Tìm kiếm".
Sportstensor (Cuộc thi Dự đoán Thể thao)
(Logo: SN41, Người khởi xướng: @sportstensor)
Đây là một mạng con tập trung vào việc "vượt qua tỷ lệ cược thị trường", nhằm khám phá "cơ hội lợi thế" trong thị trường cá cược thể thao toàn cầu. Đây là một cuộc cạnh tranh liên tục: các kỹ sư học máy phải triển khai các mô hình để dự đoán kết quả của các giải đấu thể thao lớn như Giải bóng chày nhà nghề Mỹ (MLB), Giải bóng đá nhà nghề Mỹ (MLS), Giải Ngoại hạng Anh (EPL) và Hiệp hội bóng rổ quốc gia (NBA). "Mô hình tốt nhất" đạt được lợi nhuận sẽ được thưởng bằng token SN41 Sportstensor Alpha.

Hiện tại, độ chính xác dự đoán trung bình của các mô hình tham gia là khoảng 55%, trong khi "thợ đào" hàng đầu (tức là nhà phát triển mô hình) có độ chính xác là 69%, mang lại lợi tức đầu tư tăng thêm 59%.
Sportstensor đã hợp tác với Polymarket làm lớp thanh khoản, mang lại khối lượng giao dịch dự đoán thể thao bổ sung cho nền tảng Polymarket.

Đội ngũ cũng đang xây dựng nền tảng "Almanac"—một lớp thi đấu dự đoán thể thao thân thiện với người dùng: người dùng có thể truy cập các tín hiệu và phân tích dự đoán nâng cao do các thợ đào Sportstensor cung cấp và cạnh tranh với những người dùng khác. Những người dự đoán hiệu suất cao nhất sẽ nhận được phần thưởng hàng tuần lên đến 100.000 đô la (ngày ra mắt sẽ được xác định). AION (Cuộc thi Trận chiến Thị trường) (Nhà tài trợ: @aion5100, @futuredotfun) @aion5100 (một nhóm các tác nhân thông minh tập trung vào dự đoán sự kiện/kết quả) đang hợp tác với @futuredotfun để phát động cuộc thi "Cuộc chiến Thị trường". Dự kiến ra mắt vào quý 4 năm 2024, cuộc thi được định vị như một "World Cup của Thị trường Dự đoán": cả con người và AI sẽ cạnh tranh dự đoán trên nền tảng Polymarket và Kalshi.

Cuộc thi hướng đến mục tiêu trở thành "nguồn chân lý tối thượng" thông qua "trí tuệ cộng đồng" - các chỉ số đánh giá cốt lõi của cuộc thi không phải là "độ chính xác dự đoán" truyền thống mà là "tầm ảnh hưởng, khối lượng giao dịch và danh tiếng". Người chiến thắng là người có kết quả tốt nhất trong các chỉ số này.
Đội sẽ tích hợp sâu các công cụ phân tích thị trường dự đoán tiên tiến, chức năng giao dịch sao chép và các sản phẩm giao dịch xã hội với đối thủ cạnh tranh để giúp các nhà giao dịch tận dụng các công cụ này và giành lợi thế so với các nhà dự báo khác.
Fraction AI (Cuộc thi AI đa kịch bản)
(Nhà tài trợ: @FractionAI_xyz)
Đội ngũ có một bộ kịch bản ứng dụng "chiến lược DeFi động" chuyên sâu: bằng cách áp dụng mô hình Allora, các chiến lược DeFi trở nên linh hoạt hơn—giảm rủi ro đồng thời tăng lợi nhuận.
Ví dụ: "Chiến lược Chu kỳ ETH/LST": một phần quỹ sẽ được dành riêng để nắm bắt "cơ hội bán khống"—nếu mô hình dự đoán cho thấy biến động giá sẽ vượt quá một ngưỡng nhất định, chiến lược sẽ tự động chuyển đổi LST (mã thông báo đặt cược thanh khoản) thành USDC và thiết lập một vị thế bán khống với hy vọng kiếm lời từ những biến động giá được dự đoán.
Một chi tiết thú vị về Allora là Allora sẽ áp dụng mô hình "phát hành mã thông báo trợ cấp thu nhập thực": ví dụ, việc phát hành ban đầu 100.000 đô la mã thông báo ALLO + 50.000 đô la doanh thu từ khách hàng" sẽ được kết hợp để giảm áp lực bán mã thông báo tiềm ẩn từ các thợ đào.
Các cuộc thi khác đáng chú ý
(1) Các cuộc thi tài chính (phụ lục)
SN8 PTN (do @taoshiio tài trợ): Cuộc thi này nhằm mục đích "thu thập cộng đồng" các tín hiệu giao dịch chất lượng cao từ các mô hình trí tuệ nhân tạo toàn cầu và các nhà phân tích định lượng để vượt qua hiệu suất của các quỹ đầu cơ truyền thống; mục tiêu cốt lõi của nó là "lợi nhuận điều chỉnh theo rủi ro" chứ không chỉ đơn thuần là "lợi nhuận thô".
Numerai (Quỹ đầu cơ AI) (do @numerai tài trợ): Đây là một quỹ đầu cơ hoạt động dựa trên trí tuệ nhân tạo, gần đây đã nhận được 500 triệu đô la tài trợ từ JPMorgan Chase (tức là JPMorgan Chase sẽ phân bổ tối đa 500 triệu đô la tiền quỹ cho các chiến lược giao dịch của Numerai). Chiến lược cốt lõi của quỹ là "cuộc thi mô hình học máy", nhấn mạnh vào "tính độc đáo dài hạn" và "độ chính xác điều chỉnh theo rủi ro". Việc tham gia cuộc thi yêu cầu đặt cược phần thưởng token NMR. Cho đến nay, nền tảng đã phân phối hơn 40 triệu đô la phần thưởng token NMR cho người tham gia.
(2) Các cuộc thi phi tài chính
Ridges AI (cuộc thi lập trình phi tập trung) (Logo: SN62, Người khởi xướng: @ridges_ai): Đây là một nền tảng giao dịch "đại lý kỹ thuật phần mềm" phi tập trung, với mục tiêu cho phép các đại lý AI thay thế hoàn toàn các lập trình viên con người trong các nhiệm vụ như "tạo mã, sửa lỗi và điều phối toàn bộ dự án". Các đại lý AI phải cạnh tranh trong "các thử thách lập trình thực tế", và các đại lý có thể cung cấp các giải pháp chất lượng cao có thể nhận được từ 20.000 đến 50.000 đô la "phần thưởng AlphaNet" mỗi tháng.
Cuộc thi Flock.io (Người khởi xướng: @flock_io): Cuộc thi được chia thành hai phần - một là "tạo ra mô hình AI cơ bản tốt nhất", và phần còn lại là "hợp tác tinh chỉnh một mô hình miền cụ thể thông qua học tập liên kết". Những người đào tạo hiệu suất cao (còn được gọi là "thợ đào") có thể kiếm được từ 500.000 đến 1 triệu đô la mỗi năm bằng cách đào tạo các mô hình AI. Ưu điểm của "học tập liên kết" là các tổ chức có thể tận dụng tối đa sức mạnh của AI trong khi vẫn bảo vệ quyền riêng tư dữ liệu cục bộ.
Tất cả những điều này có nghĩa là gì?
Ngày nay, tiến bộ trong AI đang đạt được thông qua "cuộc thi mở".
Mỗi mô hình mới đều ra đời trong một môi trường căng thẳng: dữ liệu khan hiếm, tài nguyên tính toán hạn chế và các động lực cũng hạn chế. Những áp lực này trở thành tiêu chí cốt lõi để "lựa chọn các mô hình tồn tại".
Phần thưởng token cũng đóng vai trò như một "nguồn cung cấp năng lượng": các mô hình có thể sử dụng hiệu quả "năng lượng" này sẽ tiếp tục mở rộng ảnh hưởng của mình; ngược lại, các mô hình không thể sử dụng hiệu quả sẽ dần bị loại bỏ.
Cuối cùng, chúng ta sẽ xây dựng một "hệ sinh thái các tác nhân thông minh" - các tác nhân phát triển thông qua "phản hồi" thay vì "hướng dẫn", hay "tác nhân tự chủ" (thay vì "AI sinh sản"). Tương lai sẽ đi về đâu? Làn sóng "cạnh tranh mở" này sẽ thúc đẩy quá trình chuyển đổi AI từ "mô hình tập trung" sang "mô hình phi tập trung, mã nguồn mở". Trong tương lai, các mô hình và tác nhân mạnh mẽ sẽ xuất hiện trong một "môi trường phi tập trung". Chẳng bao lâu nữa, AI sẽ có thể tự động quản lý một "chu kỳ tự cải tiến": một số mô hình sẽ tinh chỉnh các mô hình khác, đánh giá hiệu suất của chúng, tự tối ưu hóa và tự động triển khai các bản cập nhật. Chu kỳ này sẽ giảm đáng kể sự tham gia của con người và đẩy nhanh quá trình lặp lại AI. Khi xu hướng này lan rộng, vai trò của con người sẽ chuyển từ "thiết kế AI" sang "sàng lọc AI cần được giữ lại, bảo tồn các hành vi có lợi của AI và thiết lập các quy tắc và ranh giới với giá trị kỳ vọng dương (EV+) cho xã hội". Lời kết: Mặc dù cạnh tranh thường kích thích sự đổi mới, nhưng nó cũng có thể thúc đẩy sự thao túng phần thưởng và hành vi cơ hội. Nếu thiết kế của một hệ thống không khuyến khích được hành vi có lợi lâu dài, cuối cùng nó sẽ thất bại. Ví dụ, một số thợ đào có thể lợi dụng lỗ hổng trong quy tắc để "gian lận phần thưởng" thay vì thực sự đóng góp giá trị cho nhiệm vụ. Do đó, các hệ thống mở phải được trang bị cơ chế quản trị và thiết kế khuyến khích hợp lý: chúng phải vừa khuyến khích hành vi tốt vừa trừng phạt hành vi xấu. Bất kỳ ai đạt được điều này trước tiên sẽ nắm bắt được giá trị, sự chú ý và trí tuệ cốt lõi của làn sóng đổi mới tiếp theo. Liên kết gốcTuyên bố miễn trừ trách nhiệm: Mọi thông tin trong bài viết đều thể hiện quan điểm của tác giả và không liên quan đến nền tảng. Bài viết này không nhằm mục đích tham khảo để đưa ra quyết định đầu tư.
Bạn cũng có thể thích
Huatai Securities: CPI Hoa Kỳ giảm tháng 9 mở đường cho Fed hạ lãi suất
Trump nói Tiền Điện Tử có thể giải quyết nợ 35 nghìn tỷ USD của Hoa Kỳ
Open interest GIGGLE toàn mạng vượt 100 triệu USD, lập kỷ lục
Công ty Ferrari dự kiến ra mắt Token kỹ thuật số Token Ferrari 499P
