Cuộc Chạm Trán Giữa Trí Tuệ Nhân Tạo Và StarCraft (P1)

Cuộc Chạm Trán Giữa Trí Tuệ Nhân Tạo Và StarCraft (P1)

Trò chơi đã được sử dụng trong nhiều thập kỷ qua như một cách để kiểm tra và đánh giá hiệu suất của hệ thống Trí tuệ nhân tạo. Cờ vua, cờ vây, bài poker, hay Dota 2 cùng rất nhiều các trò chơi khác đã từng là mục tiêu chinh phục của cộng đồng Trí tuệ nhân tạo thế giới. Khi năng lực nghiên cứu tăng lên, con người lại tìm kiếm các trò chơi có độ phức tạp cao để chinh phục, và cũng để giải quyết các vấn đề khác nhau của khoa học và thế giới.

Trong những năm gần đây, StarCraft - một trong những trò chơi Chiến lược thời gian thực (Real-time Strategy Game) “khó nhằn” nhất, đồng thời là một trong những môn thể thao điện tử lâu đời nhất, đã nổi lên như một thách thức lớn đối với nghiên cứu AI. Mời bạn đọc theo dõi bài viết dưới đây để cùng tìm hiểu hành trình mà Trí tuệ nhân tạo chinh phục trò chơi này.

StarCraft - Tựa game chiến thuật thời gian thực phức tạp nhất

StarCraft là trò chơi Chiến lược thời gian thực (tiếng Anh: Real-time Strategy, gọi tắt là RTS). Đây là thể loại trò chơi điện tử chiến lược mà người chơi không phải đi theo lượt như cờ vây hay cờ vua. Cờ vây hay cờ vua là những trò chơi hai người, với toàn bộ thông tin được hiện ra trên bàn cờ (nghĩa là không có thông tin nào từ đối thủ bị ẩn đi). Trong mỗi vòng sẽ có một quyết định được đưa ra, và lần lượt từng người chơi sẽ thực hiện quyết định đó. Tuy nhiên, trò chơi chiến lược thời gian thực lại phức tạp hơn rất nhiều.

Đây là trò chơi với thông tin không hoàn hảo, bạn sẽ không biết chính xác đối thủ của mình đang làm gì và sẽ làm gì tiếp theo. Đồng thời bạn phải đưa ra nhiều quyết định tại cùng một thời điểm, sẽ có nhiều tình huống bất ngờ xảy ra trong trận đấu cần được đưa ra quyết định chính xác. Trò chơi sẽ thay đổi từng giây từng phút, theo thời gian thực, theo nhiều kịch bản và ngã rẽ khác nhau, không giống với những chiến lược đã được định sẵn trong cờ vua và cờ vây, chính điều này làm StarCraft “khó nhằn” hơn rất nhiều.

StarCraft II: Wings of Liberty được sản xuất và phát hành bởi Blizzard Entertainment, một công ty điện tử của Mỹ có trụ sở tại Irvine, California. Game lấy bối cảnh một vũ trụ giả tưởng, có lối chơi phong phú, đa tầng, được thiết kế để thách thức trí tuệ con người. Cùng với tựa game gốc là StarCraft I, đây là một trong những trò chơi lớn nhất và thành công nhất mọi thời đại, với các giải đấu thể thao điện tử đã kéo dài hơn 20 năm. 

Một ấn phẩm của game StarCraft II (Nguồn ảnh: Google)

Có một số thể thức khác nhau để chơi trò chơi này. Tuy nhiên, thể thức phổ biến nhất, được sử dụng nhiều nhất trong các giải đấu chính là solo 1v1 trong 5 ván game. Để bắt đầu, người chơi phải chọn một trong ba “chủng tộc” khác nhau - Zerg, chủng tộc côn trùng; Terran, chủng tộc con người; và Protoss, chủng tộc robot. Mỗi người chơi bắt đầu với một số đơn vị lính, các đơn vị này thu thập các nguồn lực cơ bản để mở thêm nhiều đơn vị và công nghệ mới. Những thứ này lại cho phép người chơi thu hoạch các tài nguyên khác, xây dựng căn cứ và công trình phức tạp hơn, đồng thời phát triển các khả năng mới có thể được sử dụng để đánh bại đối thủ. Người chơi sẽ giành chiến thắng sau khi đánh bại hết lính của đối thủ hoặc đối thủ nhận thua cuộc.

StarCraft - Thách thức của Trí tuệ nhân tạo

Để chiến thắng trò chơi này, người chơi phải cân bằng giữa việc quản lý tài nguyên và quản lý các đơn vị dân. Việc cân bằng giữa các chiến lược ngắn hạn và chiến lược dài hạn để thích ứng với các tình huống bất ngờ, đặt ra một thách thức to lớn đối với Trí tuệ nhân tạo. 

Những thách thức này bao gồm:

Lý thuyết trò chơi: StarCraft giống như oẳn tù tì, không có một chiến lược tốt nhất nào. Do đó, quá trình đào tạo AI cần liên tục khám phá và mở rộng các chiến lược mới.

Thông tin không hoàn hảo: Không giống như các trò chơi như cờ vua hoặc cờ vây nơi người chơi nhìn thấy mọi thứ về đối thủ, người chơi StarCraft phải chủ động thực hiện các hành động “do thám” để phát hiện các thông tin quan trọng bị ẩn đi.

Lập kế hoạch dài hạn: Mỗi game đấu của StarCraft có thể kéo dài đến một giờ đồng hồ để hoàn thành, điều này có nghĩa các hành động được thực hiện ở đầu game chưa chắc đã có tác dụng ngay tức thời. Bạn cần tính toán, lên một kế hoạch dài hạn để những hành động trước đó mang lại kết quả có lợi ở cuối game.

Thời gian thực: Không giống như các trò chơi trên bàn truyền thống (cờ vua, cờ vây), nơi người chơi luân phiên thực hiện các nước đi, người chơi StarCraft và đối thủ của họ phải thực hiện các hành động liên tục khi trò chơi diễn ra.

Không gian hành động lớn: Hàng trăm đơn vị và căn cứ khác nhau phải được điều khiển cùng lúc, trong thời gian thực, dẫn đến một tổ hợp vô cùng lớn các khả năng có thể xảy ra trong trò chơi này. Theo tính toán, số lượng khả năng có thể xảy ra trong một game đấu StarCraft là 101685, con số đó ở cờ vua là 1047 và cờ vây là 10170. Nên nhớ, tổng số nguyên tử trong vũ trụ đã biết đến ước tính từ 1078 đến 1082, tức là chỉ bằng 1/20 số lượng khả năng có thể xảy ra trong một game đấu của StarCraft.

Số khả năng có thể xảy ra trong 1 game đấu của StarCraft II và các trò chơi khác

(Nguồn ảnh: Liv_Boeree)

Chính vì những đặc điểm kể trên đã khiến cho StarCraft hay những tựa game chiến thuật thời gian thực trở thành thử nghiệm tuyệt vời đối với AI. Nhờ có lượng dữ liệu trong một game đấu, trong số lượng game đấu mà một người chơi chuyên nghiệp đã trải qua trong suốt 20 năm, và tổng hợp từ nhiều người chơi chuyên nghiệp khác nhau, chúng ta sẽ có một lượng dữ liệu khổng lồ để huấn luyện các AI. Cuối cùng, cuộc đấu trí với con người sẽ là một bài test hiệu quả.

Chúng ta sẽ kết thúc phần 1 của hành trình tại đây. Phần tiếp theo sẽ giới thiệu sản phẩm Trí tuệ nhân tạo của Google DeepMind - AlphaStar, cách nó được huấn luyện và diễn biến cuộc so tài giữa AlphaStar và game thủ StarCraft hàng đầu thế giới.

Đọc tiếp phần 2 tại đây!