Trí tuệ nhân tạo và chặng đường 50 năm

9 trang Gia Huy 9840

Download

Bạn đang xem tài liệu "Trí tuệ nhân tạo và chặng đường 50 năm", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

tri_tue_nhan_tao_va_chang_duong_50_nam.pdf

Nội dung text: Trí tuệ nhân tạo và chặng đường 50 năm

Trí tuệ nhân tạo và chặng đường 50 năm LƯỢC SỬ NGÀNH TRÍ TUỆ NHÂN TẠO Trước hết xin nĩi về chữ ‘trí tuệ nhân tạo’, vốn được dùng rộng rãi trong cộng đồng cơng nghệ thơng tin (CNTT). Trí tuệ nhân tạo (TTNT), tiếng Anh là artificial intelligence hay chữ viết tắt được dùng phổ biến là AI, cịn cĩ thể hiểu bình dân hơn là ‘thơng minh nhân tạo’, tức là sự thơng minh của máy mĩc do con người tạo ra, đặc biệt tạo ra cho máy tính, robot, hay các máy mĩc cĩ các thành phần tính tốn điện tử. Trí tuệ nhân tạo là một lĩnh vực của khoa học và cơng nghệ nhằm làm cho máy cĩ những khả năng của trí tuệ và trí thơng minh của con người, tiêu biểu như biết suy nghĩ và lập luận để giải quyết vấn đề, biết giao tiếp do hiểu ngơn ngữ và tiếng nĩi, biết học và tự thích nghi, Mong muốn làm cho máy cĩ những khả năng của trí thơng minh con người đã cĩ từ nhiều thế kỷ trước, tuy nhiên TTNT chỉ xuất hiện khi con người sáng tạo ra máy tính điện tử (MTĐT). Alan Turing−nhà tốn học lỗi lạc người Anh, người được xem là cha đẻ của Tin học do đưa ra cách hình thức hĩa các khái niệm thuật tốn và tính tốn trên máy Turing−một mơ hình máy tính trừu tượng mơ tả bản chất việc xử lý các ký hiệu hình thức−cĩ một đĩng gĩp quan trọng và thú vị cho TTNT vào năm 1950, gọi là phép thử Turing. Phép thử Turing là một cách để trả lời câu hỏi ‘máy tính cĩ Alan Turing (1912-1954) biết nghĩ khơng?’, được phát biểu dưới dạng một trị chơi. Hình dung cĩ ba người tham gia trị chơi, một người đàn ơng (A), một người đàn bà (B) và một người chơi (C). Người chơi ngồi ở một phịng tách biệt với A và B, khơng biết gì về A và B (như hai đối tượng ẩn X và Y) và chỉ đặt các câu hỏi cũng như nhận trả lời từ A và B qua một màn hình máy tính. Người chơi cần kết luận trong X và Y ai là đàn ơng ai là đàn bà. Trong phép thử này, A luơn tìm cách làm cho C bị nhầm lẫn và B luơn tìm cách giúp C tìm được câu trả lời đúng. Phép thử Turing thay A bằng một máy tính, và bài tốn trở thành liệu C cĩ thể phân biệt được trong X và Y đâu là máy tính đâu là người đàn bà. Phép thử Turing cho rằng máy tính là thơng minh (qua được phép thử) nếu như biết cách làm sao cho C khơng thể chắc chắn kết luận của mình là đúng. Tuy phép thử Turing đến nay vẫn được xem cĩ tầm quan trọng lịch sử và triết học hơn là giá trị thực tế (vì con người vẫn chưa làm được máy hiểu ngơn ngữ và biết lập luận như vậy), ý nghĩa rất lớn của nĩ nằm ở chỗ đã nhấn mạnh rằng khả năng giao tiếp thành cơng của máy với con người trong một cuộc đối thoại tự do và khơng hạn chế là một biểu hiện chính yếu của trí thơng minh nhân tạo.
Trăn trở về những chiếc máy tính thơng minh đã thơi thúc nhiều nhà khoa học trong nhiều năm tiếp theo, để rồi TTNT−với tư cách là một khoa học độc lập−đã ra đời chỉ chừng 10 năm sau khi những chiếc máy tính đầu tiên được tạo ra để dùng chính cho việc tính tốn (thực hiện các phép tính số học cộng trừ nhân chia và so sánh bằng nhau khác nhau). Người ta vẫn lấy hội nghị mùa hè năm 1956 tại trường Dartmouth ở Mỹ làm sự kiện ra đời của ngành TTNT. Hội nghị đầu tiên này do Marvin Minsky và John McCarthy tổ chức với sự tham dự của vài chục nhà khoa học, trong đĩ cĩ Allen Newell và Herbert Simon. Bốn người này luơn John McCarthy Herbert Simon Donald Michie được coi là những người sáng lập của ngành TTNT. Nhiều người tham gia hội nghị Dartmouth sau này đã trở thành những thủ lĩnh về nghiên cứu TTNT trong nhiều thập kỷ, trong đĩ cĩ giáo sư Donald Michie, một người tiên phong về TTNT ở châu Âu, người đã lập ra phịng thí nghiệm TTNT nổi tiếng tại đại học Edinburgh ở Anh. Chính tại hội nghị Dartmouth, McCarthy đã đề nghị tên gọi ‘artificial intelligence’. Mặc dù cịn tranh cãi trong một thời gian, tên này vẫn được thừa nhận và dùng cho đến nay. Ba trong bốn người sáng lập ngành TTNT đều ở tuổi 29 vào mùa hè 1956 tại Dartmouth (trừ Herbert Simon, người nhận giải Nobel năm 1978 về những đĩng gĩp trong nghiên cứu về quá trình trợ giúp quyết định trong kinh tế, năm đĩ 40). Những người sáng lập ngành TTNT đều lần lượt được nhận giải Turing của ACM (Hội Tin học lớn nhất thế giới)−được xem là giải Nobel của Tin học, mỗi năm thường chỉ trao cho một người: Minsky (1969), McCarthy (1971), Newell và Simon (1975). Tính đột phá của tuổi trẻ và tài năng đã thơi thúc họ nghĩ đến, đặt ra và đi tìm lời giải cho những vấn đề nền tảng của TTNT, như đề xuất Dartmouth cho những người làm nghiên cứu về TTNT: “Mọi khía cạnh của khả năng học tập cũng như mọi tính chất khác của trí thơng minh đều cĩ thể mơ tả được thật chính xác sao cho cĩ thể làm ra máy để thực hiện chúng”, hoặc giả thuyết của Newell và Simon tiên đốn bản chất của trí thơng minh là việc điều khiển ký hiệu: “Mọi hệ ký hiệu hình thức đều cĩ các cách cần và đủ để thực hiện các Gặp Minsky ở PRICAI-96, Cairns 1996 hành động thơng minh phổ quát”. Một chuyện được quan tâm nữa là liệu máy cĩ mơ phỏng được bộ não con người? Một số người khi này đã quả quyết rằng về mặt cơng nghệ hồn tồn cĩ thể sao chép y chang bộ não người vào phần cứng và phần mềm máy tính, và do vậy bộ não mơ phỏng trong máy tính hầu như hồn tồn giống bộ não thật. Nhiều hệ lập luận tổng quát hay các hệ hiểu ngơn ngữ con người (thường được gọi là ‘ngơn ngữ tự nhiên’) như ELIZA hay SHRDLU (tên này được ghép từ sáu chữ cái xuất hiện nhiều nhất trong tiếng Anh) được phát triển trong thời gian này. Rất lạc quan, năm 1965 Simon tuyên bố: “Máy mĩc trong vịng hai
mươi năm nữa sẽ cĩ khả năng làm tất cả mọi việc con người làm”, hoặc năm 1967 Minsky tiên đốn: “Quãng một thế hệ nữa, việc tạo ra trí thơng minh nhân tạo sẽ cơ bản được giải quyết”. Tuy nhiên nhiều mong đợi đã khơng đến. Những tiên đốn này và nhiều tiên đốn khác đã khơng thành sự thật. Các hệ thơng minh vạn năng dựa trên lập luận hình thức đã khơng thành cơng. Sau hơn một thập kỷ của những hứng khởi và lãng mạn, thập kỷ 70 của thế kỷ trước là những năm thiên hạ thất vọng tràn trề về TTNT. Chính phủ Mỹ và Anh đã cắt bỏ nhiều đề tài nghiên cứu trong lĩnh vực này. Liệu máy tính cĩ mơ phỏng được bộ não con người? Và nếu vậy, máy cũng sẽ cĩ Nhưng những thất bại ở giai đoạn này cũng giúp giới được trí tuệ như con người? nghiên cứu hiểu rõ hơn những hạn chế tính tốn của các hệ logic hình thức, hạn chế về những gì máy cĩ thể làm được như đã chỉ ra bởi định lý Gưdel về tính khơng đầy đủ, phát biểu năm 1931, rằng với mọi hệ hình thức đều cĩ những mệnh đề đúng khơng thể chứng minh được. Con người cũng hiểu rõ hơn khả năng tính tốn bằng máy phụ thuộc rất nhiều vào độ phức tạp tính tốn của từng bài tốn. Rất nhiều bí ẩn vẫn thách thức ở phía trước. Câu hỏi ‘P = NP?’ về độ phức tạp tính tốn do Stephen Cook đặt ra năm 1971 đã trở thành một trong bảy bài tốn thách đố của thế kỷ 21 do Viện Tơi khơng tìm được một Tốn Clay cơng bố ngày 24.5.2000. (Nĩi thuật tốn thời gian đa thức để giải bài tốn SAT, nhưng nơm na, P là tập hợp các bài tốn cĩ thể giải tất cả những người nổi trên máy với thời gian là một hàm đa thức tiếng này cũng thế. của kích thước dữ liệu, cịn NP là tập hợp con của tập non-P các bài tốn được dự đốn là chỉ giải được với thời gian hàm mũ của kích thước dữ liệu, nhưng cĩ đặc điểm là ta cĩ thể kiểm chứng trong thời gian đa thức xem các nghiệm dự đốn của mỗi bài tốn trong NP cĩ thật sự là nghiệm hay khơng.) Rất nhiều vấn đề của TTNT liên quan đến bài tốn này. Những năm đầu thập kỷ 80 của thế kỷ trước đã chứng kiến sự bắt đầu của một giai đoạn quãng 15 năm của sự hồi sinh, bùng nổ và thi đua quốc tế trong ngành TTNT. Ý tưởng cơ bản để phát triển TTNT khi này là sự thơng minh của máy tính khơng thể chỉ dựa trên việc suy diễn logic mà phải dựa cả vào tri thức con người, và dùng khả năng suy diễn của máy để khai thác các tri thức này. Cốt lõi của TTNT cĩ thể diễn giải bởi cơng thức TTNT = Tri thức + Suy diễn Thành quả và nỗ lực tiêu biểu trong giai đoạn này là sự phát triển của các hệ chuyên gia (expert systems). Mỗi hệ chuyên gia về cơ bản gồm hai thành phần: một cơ sở tri thức chứa các tri thức của chuyên gia trong một lĩnh vực và một cơ chế suy diễn logic nhằm vận dụng các hiểu biết này để giải quyết các vấn đề cụ thể, với hiệu quả như chính các chuyên gia giải quyết. Các hệ chuyên gia được nghiên cứu và xây dựng khắp nơi. Hai hệ tiêu biểu là DENDRAL và MYCIN. Hệ DENDRAL nhằm giúp các nhà nghiên cứu hĩa học hữu cơ xác định các phân tử hữu cơ chưa biết dựa trên phân tích phổ của chúng và
các tri thức hĩa học. DENDRAL do Edward Feigenbaum−một học trị của Simon, người được coi là cha đẻ của các hệ chuyên gia và được giải Turing năm 1994−và đồng nghiệp làm tại đại học Stanford từ cuối những năm 1960. MYCIN là hệ chuyên gia cĩ cơ sở tri thức chừng 600 luật về y học cĩ tính đến yếu tố bất định. Từ quãng những năm đầu của thập kỷ 90, khái niệm hệ chuyên gia được nhìn rộng hơn thành khái niệm các hệ dựa trên tri thức (knowledge-based systems) theo nghĩa cơ sở tri thức khơng nhất thiết cần hạn chế với tri thức chuyên gia. Ý thức được vai trị của tri thức trong các hành vi thơng minh của máy, con người lại phải đối mặt với bài tốn làm sao cĩ được tri thức để máy dùng. Trở ngại này vốn luơn luơn là điểm ‘tắc’ trong sự phát triển TTNT. Quãng 15 năm này là thời phát triển sơi nổi nhiều nội dung của TTNT: về xử lý ngơn ngữ tự nhiên, như việc dịch các văn bản từ một ngơn ngữ này sang một ngơn ngữ khác; về sự thăng hoa của các phương pháp mạng neuron, vốn ra đời từ 1957 dưới dạng các perceptron đơn giản nhưng bị hững hờ khi con người nhận ra các hạn chế của chúng; về tính tốn tiến hĩa, tiêu biểu là các giải thuật di truyền; về các tác tử tự trị và thơng minh, những thứ cĩ vai trị rất lớn với TTNT trong Máy tính thế hệ 5 PIM/p: suy diễn và hiểu ngơn ngữ những năm về sau, Một chuyện đáng nhớ trong giai đoạn này là cuộc thi đua quốc tế về TTNT, khởi nguồn từ đề án máy tính thế hệ thứ 5 FGCS (Fifth Generation Computer Systems) của Nhật Bản do Bộ Ngoại thương và Cơng nghiệp (MITI) phát động. FGCS kéo dài trong 10 năm (1982- 1992) với kinh phí ban đầu 450 triệu USD vào năm 1982. Đề án FGCS nhằm làm ra các hệ máy tính cĩ khả năng suy diễn và giao tiếp bằng ngơn ngữ tự nhiên trên nền tính tốn song song. Mặc dù cuối cùng bị đánh giá là thất bại do khơng đạt được các mục tiêu, đề án FGCS đã kích thích một cuộc thi đua quốc tế trong giai đoạn hồi sinh của TTNT, đặt ra và thách thức nhiều vấn đề cho giới nghiên cứu trên tồn thế giới. Nước Mỹ đã dành một kinh phí tương đương với FGCS trong các dự án TTNT của DARPA (cơ quan quản lý các đề tài nghiên cứu tiên tiến của quốc phịng). Các cường quốc khoa học ở châu Âu như Anh, Pháp, Đức cũng cĩ những đầu tư rất lớn cho TTNT. Từ 1956 đến nay đã là chặng đường 50 năm. Ba giai đoạn ta vừa nĩi trong 40 năm đầu cĩ thể gọi tên là ‘mơ ước’, ‘thất bại’ và ‘hồi sinh’. Vậy hơn mười năm qua TTNT đã ra sao? khai phá dữ liệu, máy tính TTNT học thống kê, ngơn ngữ tác tử Web ngữ nghĩa, điện tử ra đời PROLOG thơng minh đầu tiên tin sinh học, hệ chuyên gia sự sống nhân tạo, mạng xã hội, đầu tiên AI phân tán ASIMO, 1941 1949 1956 1958 1968 1970 1972 1982 1986 1995 1997 2000 2005 giải thuật di truyền, Robo máy tính SHRDLU thách thức mạng Cup DARPA thương nơron mại đầu ngơn ngữ LISP Đề án máy tính hệ TTNT hạ tiên thế hệ thứ năm vơ địch cờ vua
Khơng thể nĩi đến sự phát triển của bất cứ lĩnh vực nào trong Tin học và CNTT nếu khơng liên hệ với hai sự kiện ‘đổi đời’: một là sự ra đời của cơng nghệ vi mạch và máy vi tính vào cuối những năm 1970 và hai là sự ra đời của Internet và sự hịa nhập của CNTT và truyền thơng (ICT) vào đầu những năm 1990. Trong một chừng mực nào đấy, từ hơn mười năm qua cĩ thể mở rộng cơng thức cơ bản của TTNT thành TTNT = Tri thức + Suy diễn + Mơi trường Ở đây ‘mơi trường’ là Internet, là các thiết bị liên lạc khơng dây, là các thiết bị tính tốn và lưu trữ thơng tin ngày càng nhỏ hơn và mạnh hơn. Cĩ thể thấy hai đặc trưng chính của TTNT trong hơn mười năm vừa qua. Thứ nhất là từ những thành bại trong giai đoạn hồi sinh, con người đã thấy rằng TTNT vẫn chỉ ở trong buổi đầu của sự phát triển, và bài học lớn nhất của những năm 1980 là TTNT khơng thể phát triển một mình, mà ngược lại những khả năng của TTNT cần phải và đã được hợp tác phát triển trong các hệ thống của CNTT và các khoa học khác. Thứ hai là nhiều lĩnh vực mới của TTNT đã ra đời và tiến triển sơi động theo sự thay đổi của mơi trường tính tốn và tiến bộ khoa học. Chẳng hạn sự xuất hiện của những hệ dữ liệu lớn với quan hệ phức tạp như dữ liệu Web, dữ liệu sinh học, thư viện điện tử, đã là động lực ra đời các ngành khai phá dữ liệu, Web ngữ nghĩa, tìm kiếm thơng tin trên Web. Thêm nữa, TTNT đã thâm nhập từ các khoa học vi mơ như gĩp phần giải các bài tốn của sinh học phân tử (tin- sinh học) đến các khoa học vĩ mơ như nghiên cứu vũ trụ, rồi cả khoa học xã hội và kinh tế như phát hiện các cộng đồng mạng trong xã hội hay phân tích các nhĩm hành vi. Cũng cĩ thể chăng gọi những năm vừa qua của TTNT là giai đoạn ‘hịa nhập’? Trong các thành cơng của TTNT giai đoạn này cĩ sự kiện máy tính thơng minh tranh tài với các kỳ thủ cờ vua, và đặc biệt máy tính Deep Blue của IBM với trí tuệ nhân tạo đã đánh bại nhà vơ địch cờ vua thế giới Garry Kasparov vào năm 1997, và cuối năm 2006 máy tính Deep Fritz lại đánh bại nhà vơ địch Kramnik. Một lĩnh vực tiêu biểu của TTNT trong giai đoạn này là các tác tử thơng minh. Tác tử (agent), theo nghĩa chung nhất, là một thực thể cĩ khả năng hành động để thực hiện những nhiệm vụ được giao. Một người đưa hàng, một luật sư hay một điệp viên là những tác tử. Một robot cứu người sau động đất hay một robot hút bụi trong nhà là những tác tử. Một chương trình được cài trên máy tính để lọc thư rác hay một chương trình luơn xục xạo trên Internet để tìm những thơng tin mới về một chủ đề là những tác tử. Nĩi nơm na, tác tử thơng minh là những tác tử biết hành động với các phẩm chất của trí thơng minh, tiêu biểu là biết nhận thức mơi trường xung quanh và biết hướng các hành động tới việc đạt mục đích. Một robot hút bụi sẽ là thơng minh nếu biết tìm đến các Người máy ASIMO đưa đồ uống cho khách theo yêu cầu chỗ bẩn trong phịng để hút bụi và khơng đi ( tới những chỗ đã làm.
Nhìn nhận các phương pháp và phát triển TTNT theo quan điểm tác tử thơng minh đang trở nên phổ biến trong những năm vừa qua. Nhiều người tin rằng, để thành cơng các hệ TTNT cần phải cĩ khả năng tự hành động và hành động linh hoạt trong một mơi trường thay đổi, khơng dự đốn được trước, chẳng hạn như Internet (đây chính là các yêu cầu cơ bản của các tác tử thơng minh). VÀI LĨNH VỰC CỦA TRÍ TUỆ NHÂN TẠO Cĩ nhiều nội dung nghiên cứu và phát triển của TTNT, từ cách để máy cĩ thể suy diễn logic và nhận thức, cách ra quyết định và giải quyết vấn đề, cách biểu diễn tri thức con người trong máy, cách lập kế hoạch hành động, hay cách máy biết tự học để tạo ra tri thức mới, đến dịch tự động các ngơn ngữ, tìm kiếm thơng tin trên Internet, robot thơng minh. Ta nĩi về một vài lĩnh vực của TTNT cĩ nhiều thay đổi trong những năm vừa qua. Xử lý ngơn ngữ tự nhiên Là việc làm cho máy cĩ thể nhận biết và hiểu tiếng nĩi và ngơn ngữ của con người. Liệu máy cĩ thể nĩi được như người? Đây là bài tốn tổng hợp tiếng nĩi, tức việc làm cho máy biết đọc các văn bản thành tiếng người. Cĩ thể hình dung nếu ta đưa cho máy các luật phát âm các âm tiết, bài tốn này sẽ là việc áp dụng các luật này vào các âm tiết trong một từ để tạo ra cách đọc từ này. Đã cĩ nhiều hệ thống tạo ra được giọng đọc tự nhiên của con người hoặc đọc giống giọng một người nào đấy, nhất là cho các ngơn ngữ được nghiên cứu nhiều như tiếng Anh. Nhưng vẫn cần rất nhiều thời gian để làm được như vậy cho các ngơn ngữ ít được nghiên cứu như tiếng Việt, hoặc làm cho máy thể hiện được buồn vui mừng giận khi nĩi như người. Liệu máy cĩ thể nhận biết được tiếng người nĩi? Đây là bài tốn nhận dạng tiếng nĩi, tức việc làm cho máy biết chuyển tiếng nĩi của người từ microphone thành dãy các từ. Dễ thấy đây là bài tốn rất khĩ, vì âm thanh người nĩi là liên tục và các âm quyện nối vào nhau, vì mỗi người mỗi giọng, vì cĩ các âm thanh khác nhiễu vào microphone, Với tiếng nĩi chuẩn, các hệ hiện đại cũng mới nhận dạng đúng được khoảng 60-70%. Đại thể, máy mới nhận biết tốt tiếng nĩi của từng người riêng biệt với lượng nhỏ từ vựng và phải ‘tập nghe’ với chính giọng của người đĩ. Với các phương pháp học thống kê trên các kho ngữ âm tốt, ta cĩ thể sớm hy vọng vào các hệ nhận dạng tiếng nĩi thơng minh và chính xác. Liệu máy cĩ hiểu được tiếng nĩi và văn bản của con người? Hiểu ngơn ngữ là một đặc trưng tiêu biểu của trí tuệ và việc làm cho máy hiểu được ngơn ngữ là một trong vài vấn đề khĩ nhất của TTNT nĩi riêng và CNTT nĩi chung. Ta lấy thí dụ của Marvin Minsky năm 1992 khi lý giải tại sao vấn đề này lại khĩ và lĩnh vực này tiến chậm: “Xét một từ, chẳng hạn ‘sợi dây’. Ngày nay khơng một máy tính nào cĩ thể hiểu nghĩa từ này như con người. Ta cĩ thể kéo một vật bằng một sợi dây, nhưng khơng thể đẩy một vật bằng sợi dây. Ta cĩ thể gĩi một gĩi hàng hoặc thả diều bằng một sợi dây, nhưng khơng thể ăn sợi dây này. Trong vài phút, một đứa trẻ nhỏ cĩ thể chỉ ra hàng trăm cách dùng hoặc khơng dùng một sợi dây, nhưng khơng máy tính nào cĩ thể làm việc này”.
Để hiểu nghĩa một câu, máy khơng chỉ cần biết nghĩa từng từ, mà trước hết phải biết phân tích được câu này về mặt ngữ pháp. Để làm việc này, đại thể máy phải tách câu thành các từ đơn lẻ hay cụm từ, nhận biết chúng là các loại từ gì, rồi xác định cấu trúc của câu, đốn nghĩa của từng từ, và giải nghĩa cả câu. Ngơn ngữ thường nhập nhằng đa nghĩa và điều này trở nên vơ cùng khĩ với máy. Lấy một thí dụ quen thuộc của câu đơn giản ‘ơng già đi nhanh quá’. Với hai cách phân tách từ và cụm từ thành (ơng già)(đi)(nhanh quá) và (ơng)(già đi)(nhanh quá), với các nghĩa khác nhau của động từ ‘đi’, của cụm từ ‘ơng già’, ta cũng cĩ dăm cách hiểu câu nĩi trên. Làm sao để máy tự động hiểu đúng nghĩa một câu nĩi bất kỳ cịn là một thách thức lâu dài của ngành TTNT. Dịch tự động Nếu chưa biết cả năm thứ tiếng Anh, Pháp, Nga, Nhật và Hàn, bạn cĩ thể hy Liên quan đến hiểu vọng một ngày gần đây máy sẽ dịch và bảo bạn rằng các câu này cùng nội dung ngơn ngữ là việc dịch tự động từ • We meet here today to talk about Vietnamese language and speech tiếng này sang tiếng processing. khác, chẳng hạn • Aujourd'hui nous nous réunissons ici pour discuter le traitement de dịch câu ‘ơng già đi langue et de parole vietnamienne. nhanh quá’ sang •Mы встрачаемся здесь сегодня, чтобы говорить о вьетнамском tiếng Anh. Việc языке и обработке речи. dịch này địi hỏi • 今日我々はここに集まりベトナム語処理について議論します. máy khơng những • 오늘 우리는 여기에 모여서 베트남어와 발언처리에 대하여 의론하겠 phải hiểu đúng 습니다. nghĩa câu tiếng Việt • Hơm nay chúng ta gặp nhau ở đây để bàn về xử lý ngơn ngữ và mà cịn phải tạo ra tiếng nĩi tiếng Việt. được câu tiếng Anh tương ứng. Nhiều dự án dịch tự động đã được theo đuổi từ hàng chục năm qua, và chắc cịn phải tiếp tục nhiều chục năm nữa để cĩ được những hệ dịch tốt. Tuy nhiên, những tiến bộ gần đây của các phương pháp dịch thống kê trên các kho ngữ liệu lớn và tốt cĩ thể cho phép đến một ngày ai cũng nhờ máy đọc được sách báo từ hàng chục thứ tiếng. Tìm kiếm thơng tin trên mạng Đây là lĩnh vực cĩ sự chia sẻ nhiều nhất giữa TTNT và Internet, và ngày càng trở nên hết sức quan trọng. Sẽ sớm đến một ngày, mọi sách báo của con người được số hĩa và để lên mạng hay các thư viện số cực lớn. Giả sử ta muốn tìm những tài liệu liên quan đến việc ‘trí tuệ nhân tạo đĩng gĩp vào việc nâng cao thành tích ở thế vận hội’. Nếu dùng Google để tìm với các từ khĩa tiếng Anh ‘artificial intelligence’, ‘performance’ và ‘olympic’ hay dùng một hệ nào đĩ như Xalộ ( để tìm với từ khĩa tiếng Việt ‘trí tuệ nhân tạo’, ‘thành tích’, ‘thế vận hội’, ta sẽ nhận được rất nhiều tài liệu khơng phải thứ ta muốn tìm, cũng như cĩ nhiều tài liệu liên quan khơng được tìm ra. Cĩ ít nhất hai cách để TTNT đĩng gĩp vào việc giải bài tốn này. Một là hệ tìm kiếm cho phép đưa vào câu hỏi ở dạng ngơn ngữ tự nhiên, phân tích để hiểu nghĩa câu hỏi và cĩ cơ chế tìm kiếm các văn bản trong thư viện theo nghĩa này. Hai là hệ tìm kiếm sẽ mơ hình các từ ‘trí tuệ nhân tạo’, ‘thành tích’, và ‘thế vận hội’, mỗi mơ hình là một tập hợp nhiều từ khác kèm theo phân bố xác suất của chúng theo những quy luật thống kê. Thay vì tìm kiếm trên mạng hay trong thư viện với ba từ khĩa, hệ sẽ tìm kiếm với ba tập hợp từ. Với
các phương pháp ‘thơng minh’ này, ta sẽ sống dễ dàng hơn trong khơng gian Internet mênh mơng đầy bí ẩn. Robot đá bĩng và robot lái xe RoboCupTM là một đề án nghiên cứu quốc tế từ 1995 nhằm phát triển TTNT, robot thơng minh và các lĩnh vực liên quan. Chọn thi đấu bĩng đá giữa các đội robot làm chủ đề nghiên cứu, đề án này hướng đến các sáng tạo cơng nghệ cĩ nhiều ý nghĩa trong xã hội và cơng nghiệp. Với mục tiêu này, RoboCup đặt ra nhiều bài tốn quan trọng địi hỏi phải tích hợp nhiều cơng nghệ, như nguyên lý các tác tử tự trị, hợp tác đa tác tử, nhận biết chiến lược, lập luận thời gian thực, cơng nghệ robot, nhận dạng và xử lý các chuỗi hình ảnh liên tục trong thời gian thực, Mục tiêu dài hạn của đề án RoboCup là đến năm 2050, sẽ làm được một đội người máy cĩ thể thắng đội bĩng đá vơ địch thế giới. Một trong các ứng dụng chính của các cơng nghệ RoboCup là giải thốt nạn nhân trong các thảm họa. Cĩ thể xem tin, hình ảnh và video của RoboCup tại Số người chết hằng năm ở Mỹ do tai nạn ơtơ chỉ đứng sau số chết do bệnh tim và ung thư. Chế tạo được ơtơ tự lái và an tồn cao là một mục tiêu được DARPA khởi xướng và hỗ trợ dưới dạng một cuộc thi mang tên ‘thách thức lớn của DARPA’ (DARPA grand chal- lenge). Cuộc thi cũng hướng đến sáng tạo các cơng nghệ tích hợp của thị giác máy, robot, lập kế hoạch tự động, học máy, lập luận, để ơtơ cĩ thể tự chạy an tồn. Cuộc thi bắt đầu năm 2004 với yêu cầu xe tự đi 150 dặm qua sa mạc Nevada ở Mỹ. Cĩ 106 đội tham gia, nhưng xe đi xa nhất chỉ được 7 dặm. Cuộc thi năm 2005 yêu cầu xe tự đi qua 132 dặm của sa mạc, đường khĩ hơn với hầm hẹp, dốc núi. Cĩ 195 đội tham gia, và sau 6 giờ đua, hai đội của đại học Stanford và Carnegie Melon đã về nhất và nhì. Tháng 11.2007, cuộc thi chuyển qua lái trong thành phố với các vận động phức tạp như tránh xe khác, đỗ xe trong bãi, qua ngã tư, tại Victorville, California với sự tham gia của 35 đội, thi qua nhiều vịng trong 8 ngày. Kết thúc cuộc đua, các đội của đại học Pittsburgh, Stanford, và Blackburg lần lượt giành các giải nhất, nhì và ba. Sẽ đến một ngày, những chiếc ơtơ chạy trên đường khơng cần người lái. Chỉ nĩi nơi muốn đến, xe sẽ đưa ta đi và đi an tồn.
TRÍ TUỆ NHÂN TẠO SẼ ĐI VỀ ĐÂU? Đây là câu hỏi khơng dễ trả lời, vì 50 năm qua ngành TTNT đã làm được rất nhiều và cũng khơng làm được rất nhiều những gì đã dự đốn. Dường như những người làm TTNT là những người lãng mạn nhất trong cộng đồng CNTT. Họ hay mơ ước, tưởng tượng và thách thức với những thứ của tương lai xa, và vì vậy cũng thường thất bại. Nhưng cĩ điều to lớn nào khi đạt được lại khơng cần những con người như vậy? Những bộ phim viễn tưởng của Hollywood hay tập trung vào người máy. Đấy thường là những người máy do con người trong một tương lai nào đấy tạo ra nhưng lại vượt ra khỏi tầm kiểm sốt của con người, thay thế con người và thống trị thế giới. Hoặc như nếu đã xem bộ phim A.I. của Steven Spielberg mấy năm trước, hẳn ta khơng thể quên chú bé người máy David, tuy cĩ trí tuệ nhân tạo vẫn luơn khát khao về một tình yêu của con người: “Mẹ ơi, hãy làm cho con thành một đứa trẻ thật”. Những gì TTNT đang tạo ra ở đầu thế kỷ 21 này khơng làm con người phải sợ hãi, mà ngược lại đang từng bước đi vào cuộc sống hàng ngày của con người. Hiểu rõ về quá khứ, con người đang thiết kế và thực hiện những chương trình nghiên cứu lớn và định hướng, như khoa học về bộ não. Những gì Alan Turing nĩi năm 1950 vẫn cĩ nghĩa trong thế kỷ 21 này: “Chúng ta chỉ cĩ thể nhìn thấy một quãng đường ngắn trước mắt, nhưng chúng ta cĩ thể thấy rất nhiều việc để làm”. Và với những gì con người đang làm, chúng ta cĩ quyền nghĩ đến một ngày máy sẽ qua được phép thử Turing, trước khi TTNT đi hết chặng đường một thế kỷ. Hồ Tú Bảo Viện Khoa học và Cơng nghệ Việt Nam Viện Khoa học và Cơng nghệ Tiên tiến Nhật Bản