Phần mềm trí tuệ nhân tạo (AI) giải được các bài toán khó cấp độ Olympic
(Dân trí) - 20 năm trước, Lương Minh Thắng là học trò chuyên toán của thầy Lê Bá Khánh Trình. Nay anh trở về trường cũ giới thiệu với thầy phần mềm trí tuệ nhân tạo (AI) giải được các bài toán khó cấp độ Olympic.
Một ngày đầu tháng 12/2023, Tiến sĩ Lương Minh Thắng đến thăm ngôi trường nơi anh đã trải qua thời trung học tại TPHCM, giới thiệu phần mềm trí tuệ nhân tạo AlphaGeometry với thầy giáo cũ của mình là Tiến sĩ Lê Bá Khánh Trình.
AlphaGeometry sử dụng mô hình ngôn ngữ thần kinh (neural language model) và được đào tạo với dữ liệu tổng hợp quy mô lớn, có thể giải các bài toán IMO (kỳ thi toán học quốc tế). Trong thử nghiệm gồm 30 bài toán cấp độ Olympic mới nhất, AlphaGeometry thể hiện năng lực đáng kinh ngạc giải được 25 bài, nghĩa là ngang ngửa thành tích của một thí sinh đạt huy chương vàng IMO.
Tác giả chính của AlphaGeometry là Tiến sĩ Trịnh Hoàng Triều (30 tuổi, tốt nghiệp Đại học New York) và nhóm cộng sự gồm các chuyên gia cao cấp tại Google DeepMind: Tiến sĩ Lương Minh Thắng, Tiến sĩ Lê Viết Quốc; cùng Tiến sĩ Yuhuai Wu (đồng sáng lập xAI, trước đây làm việc tại Google).
Giải được các bài toán IMO ở cấp độ đoạt huy chương là ước mơ của hầu hết học sinh giỏi toán trên khắp thế giới. Tiến sĩ Lê Bá Khánh Trình đã trở thành người Việt đầu tiên đoạt huy chương vàng IMO (năm 1979), và là người Việt duy nhất đến nay từng giành giải thưởng đặc biệt của kỳ thi này nhờ lời giải đẹp và ngắn gọn cho bài toán hình học.
Khi Tiến sĩ Lương Minh Thắng giới thiệu AlphaGeometry với thầy giáo cũ của mình, anh nhận được sự chia sẻ "rất ấn tượng!". Tuy nhiên, "thầy Khánh Trình vẫn chưa hài lòng với lời giải của AI vì nó thiếu linh hồn, thiếu vẻ đẹp của một lời giải mà thầy kỳ vọng", Tiến sĩ Thắng kể.
Tiến sĩ Lương Minh Thắng (ngoài cùng bên phải) và tiến sĩ Lê Bá Khánh Trình (giữa) đang thảo luận một bài toán của kỳ thi IMO 2015 mà AlphaGeometry đã làm được. (Ảnh: Wendy Uyên Nguyễn)
Về phần mình, Tiến sĩ Lương Minh Thắng tin rằng AlphaGeometry đánh dấu một cột mốc quan trọng hướng tới những phần mềm có trí thông minh giống con người và có khả năng tự học. Đây chính là điều kiện tiên quyết tiến tới siêu trí tuệ nhân tạo AGI.
Từng là học sinh chuyên toán Trường phổ thông Năng khiếu Đại học Quốc gia TPHCM, Tiến sĩ Lương Minh Thắng học ngành Khoa học máy tính tại Đại học Quốc gia Singapore, lấy bằng Tiến sĩ Khoa học máy tính của Đại học Stanford (Hoa Kỳ) năm 2016 và đã có 7 năm gắn bó với các dự án AI của Google.
Tại Google DeepMind, Tiến sĩ Lương Minh Thắng xây dựng các mô hình tiên tiến nhất về cả ngôn ngữ (QANet, ELECTRA) và tầm nhìn (UDA, NoisyStudent). Anh là đồng sáng lập dự án Meena, chatbot tốt nhất thế giới vào năm 2020, sau này trở thành Google LaMDA, Bard và hiện là Gemini - sản phẩm AI chính của Google.
Bên cạnh mối duyên với AI trong quá trình học tập và nghiên cứu, Tiến sĩ Thắng còn nên duyên với Thạc sĩ Wendy Uyên Nguyễn, Giám đốc Đối ngoại toàn cầu, nhà sáng lập của Viện Vi sinh & Chống dịch Stanford (Đại học Stanford) cũng nhờ AI.
Nhà báo Võ Thành, báo Dân trí, có cuộc trò chuyện với hai nhà nghiên cứu trẻ Lương Minh Thắng và Wendy Uyên Nguyễn.
Võ Thành: Tiến sĩ Lương Minh Thắng đã trở thành nhà nghiên cứu cấp cao của Google như thế nào?
- Lương Minh Thắng: Tôi chính thức làm việc ở Google vào năm 2016, nhưng mối duyên bắt đầu từ 2014 khi tôi vào thực tập tại Google Brain. Lúc đó tôi tham gia dự án nâng cao chất lượng dịch thuật, nghiên cứu việc áp dụng mạng nơron thần kinh nhân tạo giúp chương trình dịch thuật có thể tự động dịch những câu phức tạp thay vì dịch những cụm từ đơn lẻ như trước.
Sứ mệnh của dự án này là giúp máy hiểu sâu hơn ý nghĩa của từ ngữ trong nhiều ngôn ngữ khác nhau, đồng thời xử lý đoạn văn dài. Với cách tiếp cận mới, những gì chúng tôi làm trong 2 năm được đánh giá bằng tổng cộng 20 năm về trước cộng lại.
Cũng từ 2014 đến 2016, tôi hoàn thành luận án Tiến sĩ của mình về dịch thuật, trở thành một trong những nhà nghiên cứu tiên phong ở lĩnh vực học sâu (deep learning), áp dụng phương pháp học máy dựa trên mạng thần kinh nhân tạo để phát triển phần mềm có khả năng tự đào tạo chính mình về dịch máy (machine translation).
Nghiên cứu của chúng tôi hỗ trợ các bản dịch được phục vụ tại translate.google.com, cho phép người dùng dịch văn bản, trang web và thậm chí cả giọng nói. Google Dịch là một sản phẩm được triển khai trong nhiều dịch vụ của Google, có tác động rộng rãi và sâu sắc trong việc giúp thu hẹp rào cản ngôn ngữ trên khắp thế giới.
Năm 2018, tôi là đồng sáng lập dự án Meena, một chatbot có thể trò chuyện với người dùng về bất cứ điều gì. Đây là hướng đi mới vì vào lúc đó các chatbot của Google hay Microsoft bị giới hạn trong các tác vụ đơn giản, có xu hướng chuyên biệt hóa vào một lĩnh vực nhất định.
Với Meena, chúng tôi muốn phát triển một chatbot có thể trò chuyện về hầu như bất cứ điều gì người dùng muốn với nội dung cụ thể và hợp lý. Nói cách khác là làm sao để bất cứ ai cũng có thể trò chuyện với máy như là một cuộc trò chuyện tự nhiên với một người thông thái, không bị giới hạn lĩnh vực, kiến thức và không bị ngắc ngứ, bối rối.
Vào năm 2020, Meena trở thành chatbot tốt nhất thế giới. Mô hình Meena có 2,6 tỷ tham số và được đào tạo trên 341 GB văn bản lọc từ các cuộc trò chuyện trên mạng xã hội thuộc phạm vi công cộng. So với mô hình tạo ra OpenAI GPT-2, Meena có dung lượng mô hình lớn hơn 1,7 lần và được đào tạo với dữ liệu nhiều hơn 8,5 lần.
Tuy nhiên Google đã không phát hành Meena lúc đó vì e ngại rủi ro. Đây là giai đoạn Microsoft vừa phát hành một chatbot AI và đã gặp một số rắc rối như trả lời thông tin sai, cãi nhau với người dùng, phân biệt chủng tộc… Chỉ một thời gian ngắn sau khi giới thiệu chatbot này thì Microsoft đã phải gỡ nó xuống để sửa chữa nó. Diễn biến này khiến Google cẩn trọng với Meena.
Đến cuối năm 2022, ChatGPT ra mắt và nhanh chóng thu hút sự chú ý nhờ việc có thể trò chuyện lưu loát trên nhiều lĩnh vực kiến thức khác nhau thì Google mới bắt đầu… giật mình chạy theo.
Hiện tại tôi tiếp tục dẫn dắt một số dự án quan trọng ở Google, xây dựng các mô hình AI tốt hơn về suy luận, phân tích logic, giải toán, xử lý hình ảnh.v.v..
Võ Thành: Xin chào chị Wendy Uyên Nguyễn. Anh Lương Minh Thắng vừa chia sẻ mối duyên với lĩnh vực trí tuệ nhân tạo, vậy còn mối duyên của hai nhà nghiên cứu trẻ người Việt trên đất Mỹ được hình thành như thế nào?
- Wendy Uyên Nguyễn: Tôi gặp gỡ và quen biết anh Thắng cũng xuất phát từ mối quan tâm chung về AI. Chuyên môn ban đầu của tôi ngành tâm lý học, nhưng về sau tôi quyết định chuyển sang ngành quản trị bệnh viện (Thạc sĩ Trường Y UCSF - University Of California San Francisco), rồi lấy thêm bằng Thạc sĩ lãnh đạo cấp cao về quản trị kinh doanh trường Đại học Stanford.
Về học thuật thì tôi và anh Thắng theo hai hướng hoàn toàn khác nhau, một người là khoa học, một người là chuyên gia chiến lược/quản trị kinh doanh, nhưng có lẽ chính vì điều này mà có thể nhìn được các góc cạnh khác nhau và hỗ trợ lẫn nhau.
Làm việc trong lĩnh vực y khoa, tôi nhận thấy việc ứng dụng công nghệ nói chung và AI nói riêng có thể giúp giảm thiểu rủi ro cho người bệnh, vì như chúng ta biết là sai sót ở một số lĩnh vực khác có thể khắc phục dù tốn kém, còn sai sót trong y tế nhiều khi phải trả giá đắt bằng chính sức khỏe, tính mạng con người.
Hồi trước tôi tham gia vào một dự án nghiên cứu mô hình công nghệ giúp các bác sĩ thực tập nghề nghiệp, rồi tình cờ gặp anh Thắng trong một nhóm bạn chơi chung, tôi đã nhờ anh làm cố vấn AI cho dự án.
Ban đầu có lẽ chúng tôi không nghĩ đến chuyện tình cảm. Nhưng bên cạnh mối quan tâm về AI, chúng tôi còn gặp nhau ở mong muốn đóng góp cho cộng đồng, làm cầu nối hợp tác khoa học - công nghệ giữa Hoa Kỳ và Việt Nam. Anh Thắng và tôi cũng có rất nhiều tâm huyết trong việc đào tạo các thế hệ tài năng về AI ở Việt Nam. Chúng tôi đã nên duyên khi đi chung một con đường như vậy.
- Lương Minh Thắng: Xin có thêm một chia sẻ là hai vợ chồng đều đam mê âm nhạc. Wendy học dương cầm ở Nhạc viện từ nhỏ, chơi đàn rất hay, còn tôi thích hát. Nhiều dịp chúng tôi gặp nhau trong nhóm bạn chơi chung đã cùng đàn, hát rất vui, từ đó trở nên thân thiết hơn.
Anh Lương Minh Thắng và chị Wendy Uyên Nguyễn khi còn là sinh viên tại Khoa quản trị kinh doanh, trường Đại học Stanford (Ảnh: NVCC)
Võ Thành: Như vậy là bên cạnh ứng dụng công nghệ thì trong câu chuyện anh Thắng và chị Wendy Uyên Nguyễn vừa kể, AI còn có vai trò kết nối tình cảm.
- Lương Minh Thắng: Vâng, trong tiếng Việt, nếu mình thêm dấu sắc ở chữ "AI" thì sẽ thành chữ "Ái", cũng có nghĩa là yêu thương.
Võ Thành: Giữa anh Thắng và chị Wendy Uyên Nguyễn luôn đồng thuận về AI hay có lúc nào tranh luận về một vấn đề cụ thể nào đó không, ví dụ như lợi ích và rủi ro của AI?
- Wendy Uyên Nguyễn: Tôi không phải kỹ sư chuyên ngành về AI, nhưng trong lĩnh vực y tế tôi thấy điều gì cũng sẽ có hai mặt tốt và xấu. Nói về rủi ro thì đó là nỗi sợ AI sẽ trở nên quá thông minh, thoát khỏi sự kiểm soát của con người, thậm chí là hủy diệt con người trong tương lai.
Nỗi lo sợ đó cũng dễ hiểu. Nhưng tôi nghĩ các nhà nghiên cứu AI cũng đã nghĩ đến vấn đề này, các chính phủ cũng tính đến việc làm thế nào để phát triển AI trong vòng kiểm soát. Vậy nên vấn đề đáng quan tâm hơn lúc này là làm sao để ứng dụng AI vào thực tế, giúp cho cuộc sống con người tốt hơn. Ví dụ như ứng dụng AI trong công nghệ lái xe tự động hay trong khám chữa bệnh…
- Lương Minh Thắng: Nếu nhìn lại 10 năm trước khi tôi đang làm nghiên cứu với sự hướng dẫn của thầy Christopher Manning - giáo sư hàng đầu trong lĩnh vực ứng dụng deep learning vào xử lý ngôn ngữ tự nhiên, thì chắc không ai tưởng tượng được ChatGPT hay Gemini có thể giúp chúng ta viết được một bài thơ tặng vợ, viết email gửi sếp xin tăng lương.v.v…
Xây dựng một mô hình ngôn ngữ tự nhiên làm được tác vụ ở mọi lĩnh vực với chất lượng hội thoại cao là điều không ai tưởng tượng được trước đây, vì mỗi tác vụ có yêu cầu riêng, rất phức tạp. Ví dụ như dịch thuật đòi hỏi khác với viết email, lại càng khác với làm thơ... Để máy làm thơ có vần điệu là một nhiệm vụ cực kỳ khó, gần như bất khả thi vào thời điểm 10 năm trước. Nhưng ngày nay việc này đã hiện hữu.
Với sự phát triển của AI hiện nay, tôi nghĩ vào năm sau, nó sẽ đạt đến những cột mốc quan trọng, chẳng hạn như sẽ có những bộ phim ngắn với chất lượng tầm cỡ Hollywood được làm từ AI, hay là những đột phá trong lĩnh vực toán học… Vậy 10 năm tới thì sao? Tôi tin chắc AI sẽ có những bước phát triển ngoài sức tưởng tượng của chúng ta.
Khi AI phát triển quá nhanh, nhiều người sẽ lo lắng vì họ không biết trước điều gì sẽ đến. Chính vì vậy đang có những nghiên cứu về vòng tròn kiểm soát AI, sao cho AI sẽ phát triển trong vòng tròn đó, không tự "nhảy" ra ngoài và người ngoài cũng không thể tấn công, chiếm quyền kiểm soát AI.
Cá nhân tôi rất vui và háo hức với sự phát triển nhanh của AI và có niềm tin AI sẽ đem đến nhiều lợi ích cho nhân loại. Chẳng hạn trong lĩnh vực y tế, với AI tạo sinh, nhân loại có thể tiến đến một tương lai khi ai đó cung cấp thông tin đầu vào về giới tính, độ tuổi, cân nặng, bệnh án… thì AI sẽ tạo ra công thức thuốc phù hợp nhất với họ. Như vậy mỗi người sẽ có một công thức thuốc riêng cho mình.
Hay là trong giáo dục, hồi xưa tôi đi học phải có chiếc máy tính cầm tay để giải toán cao cấp, còn hiện nay AI chính là siêu máy tính. Với AI, các em nhỏ có thể tìm ra những định luật toán học mới, những nghiên cứu mới về vật lý, về không gian, thời gian… Nghĩa là AI có thể hỗ trợ các em khám phá vũ trụ, khám phá hố đen thời gian và những điều kỳ bí mà nhân loại chưa hiểu hết. Demis Hassabis, người sáng lập và giám đốc điều hành của Google DeepMind, từng nói một câu tôi rất tâm đắc, đó là AI có tiềm năng trở thành một trong những công nghệ quan trọng và có lợi nhất từng được phát minh, là công cụ giúp chúng ta tìm hiểu về khoa học và về tương lai nhân loại.
Võ Thành: Trở lại với dự án Meena, Google từng có trong tay một chatbot mạnh mẽ song lại không phát hành, trong khi đó OpenAI đã đi trước với việc cho ra mắt ChatGPT vào tháng 11/2022. Tình thế này đặt nhóm dự án AI của Google đứng trước thách thức ra sao?
- Lương Minh Thắng: ChatGPT ra đời, thu hút sự quan tâm cực lớn, là cú sốc dẫn đến việc Google phải phát lệnh "Code Red" toàn công ty.
Lệnh "Code Red" nghĩa là báo động đỏ, công ty ở vào trạng thái nguy hiểm. Ngay sau khi ChatGPT xuất hiện, chúng tôi bước vào chiến dịch 100 ngày của cuộc đua AI.
Từ chatbot Meena, nhóm chúng tôi phát triển lên thành Bard (hiện là Gemini), sản phẩm AI chính của Google, phát hành tháng 2/2023 (khoảng 100 ngày sau khi ChatGPT ra đời). Sở dĩ chúng tôi có thể triển khai một dự án khó với tốc độ nhanh như vậy là nhờ Google đã có những nghiên cứu về AI từ trước. Ví dụ như nghiên cứu về dịch thuật của tôi dựa trên kiến trúc transformer (mô hình học sâu về xử lý ngôn ngữ tự nhiên), đây là kiến trúc hỗ trợ hầu hết các mô hình ngôn ngữ lớn và đã cách mạng hóa lĩnh vực AI. ChatGPT hay Gemini đều được phát triển trên nền tảng kiến trúc transformer.
Hơn nữa, Google có những kỹ sư rất giỏi, những người sở hữu khả năng xây dựng mọi thứ từ không thành có; rồi Google cũng làm chủ được chip GPU và nguồn dữ liệu khổng lồ để đào tạo AI, nhiều kênh phân phối sản phẩm như Gmail, Youtube…
Tất nhiên, bên cạnh những điểm mạnh và lợi thế cạnh tranh, tôi nghĩ vì Google là tập đoàn lớn nên việc triển khai các dự án thường phải theo một quy trình cẩn trọng. Điều này khiến Google bị chậm tốc độ công bố sản phẩm. Các hãng khác thì họ linh hoạt hơn, có khi sản phẩm còn lỗi vẫn công bố.