
AlphaGo là một chương trình máy tính do Google DeepMind tại Luân Đôn phát triển, chuyên biệt cho việc chơi cờ vây. Vào tháng 12 năm 2015, AlphaGo đã ghi dấu mốc lịch sử khi trở thành chương trình máy tính đầu tiên giành chiến thắng trước một kỳ thủ cờ vây chuyên nghiệp trên bàn cờ kích thước 19x19.
Tiếp nối thành công đó, tháng 3 năm 2016 chứng kiến AlphaGo tiếp tục khẳng định sức mạnh bằng việc vượt qua Lee Sedol ở ba ván đấu đầu tiên trong một trận đấu đối kháng gồm năm ván. Đây là lần đầu tiên một phần mềm chơi cờ vây có thể đánh bại một kiện tướng 9-dan mà không cần bất kỳ lợi thế nào.
Tuy nhiên, Lee Sedol đã giành chiến thắng trong ván đấu thứ tư, cho thấy sự cạnh tranh gay gắt và tính phức tạp của trò chơi này.
Thuật toán của AlphaGo được xây dựng dựa trên sự kết hợp của nhiều kỹ thuật tiên tiến, bao gồm kỹ thuật máy học, kỹ thuật tìm kiếm dạng cây, và quá trình luyện tập mở rộng. Quá trình luyện tập này bao gồm cả việc học hỏi từ các ván đấu do máy tính và con người thực hiện.
Điều này có nghĩa là, thay vì được lập trình với các quy tắc cứng nhắc, AlphaGo được thiết kế để tự nghiên cứu các trận đấu đã diễn ra, tự mô phỏng các ván cờ và liên tục cải thiện khả năng của mình.
Cờ vây được đánh giá là một trong những môn thể thao trí tuệ mà việc giành chiến thắng trước con người khó khăn hơn cờ vua đối với máy tính, do số lượng nhánh rẽ trong mỗi nước đi lớn hơn rất nhiều. Điều này gây khó khăn cho việc áp dụng các phương pháp trí tuệ nhân tạo truyền thống như Alpha-beta pruning, Tree traversal hay Heuristic Search.
Hai thập kỷ sau khi Deep Blue của IBM vượt qua nhà vô địch cờ vua thế giới Garry Kasparov vào năm 1997, các chương trình cờ vây mạnh mẽ nhất sử dụng trí tuệ nhân tạo chỉ đạt đến trình độ 5-dan nghiệp dư và chưa thể đối đầu thành công với một kỳ thủ cờ vây chuyên nghiệp ngay cả khi được ưu ái. Tuy nhiên, tình hình đã có sự cải thiện đáng kể, khi phần mềm cờ vây Zen đã đánh bại Takemiya Masaki hai lần vào năm 2012. Đến năm 2013, Crazy Stone cũng đã giành chiến thắng trước Yoshio Ishida.
AlphaGo đã đánh dấu một bước tiến vượt bậc so với các phần mềm cờ vây trước đây. Trong 500 ván đấu với các chương trình cờ vây hiện có, bao gồm cả Zen và Crazy Stone, AlphaGo chỉ sử dụng một máy tính duy nhất và giành chiến thắng tuyệt đối.
Đặc biệt, AlphaGo đã đánh bại Fan Hui, nhà vô địch cờ vây châu Âu hạng 2-dan chuyên nghiệp với tỷ số thuyết phục 5-0. Tiếp đó, AlphaGo đã giành chiến thắng trước Lee Sedol trong một trận đấu lịch sử với tỷ số 3-1.
Video tường thuật các ván đấu giữa AlphaGo và Lee Sedol
AlphaGo đã được kiểm tra trên nhiều cấu hình phần cứng khác nhau, với số lượng CPU và GPU đa dạng, hoạt động ở chế độ không đồng bộ hoặc phân phối. Thời gian suy nghĩ cho mỗi nước đi là khoảng hai giây.
AlphaGo kết hợp kiến thức máy móc, kỹ thuật tìm kiếm dạng cây, cùng với quá trình học tập dựa trên các kịch bản chơi của cả con người và máy tính. Nó sử dụng thuật toán tìm kiếm dạng cây Monte Carlo, được điều khiển bởi mạng lưới giá trị (value network) và mạng lưới nước đi (policy network), cả hai đều được xây dựng dựa trên công nghệ mạng nơ-ron sâu.

Mạng lưới "thần kinh" của AlphaGo ban đầu được khởi tạo bằng cách học hỏi từ lối chơi của các kỳ thủ chuyên nghiệp. Nó được huấn luyện để mô phỏng con người, cố gắng tái hiện các nước đi của các chuyên gia cờ vây trong lịch sử, dựa trên cơ sở dữ liệu khoảng 30 triệu nước đi. Khi đạt đến một trình độ nhất định, nó tiếp tục được đào tạo bằng cách tự chơi một số lượng lớn các ván đấu với chính mình, từ đó tự học hỏi và nâng cao khả năng chơi.
Myungwan Kim, một kỳ thủ hạng 9-dan, đã mô tả AlphaGo có lối chơi tương tự như con người trong trận đấu với Fan Hui. Trọng tài Toby Manning cũng nhận xét phong cách chơi của nó là thận trọng.
Hiện tại, người dùng chưa thể Tải về mã nguồn của AlphaGo, nhưng trên trang web chính thức của chương trình, bạn có thể xem lại các ván đấu giữa AlphaGo và Lee Sedol, đồng thời tải xuống file SGF của trò chơi. Hoặc nhấp vào Tải về để tải file SGF, sau đó sử dụng SgfEditor để xem.
7 nhận xét

