Hơn 90% ứng dụng của chuyển đổi số có liên quan tới trí tuệ nhân tạo và phân tích dữ liệu. “Do vậy, trí tuệ nhân tạo chính là cốt lõi để chuyển đổi số” hay nói cách khác muốn chuyển đổi số phải phát triển và ứng dụng trí tuệ nhân tạo - ông Nguyễn Mạnh Quý Giám đốc Trung tâm Không gian mạng Viettel (Viettel Cyberspace) cho biết.
Viettel Cyberspace được thành lập vào năm 2014 với mục đích ban đầu là lắng nghe thông tin dư luận trên không gian mạng. Năm 2020, Trung tâm chính thức chuyển đổi thành đầu não nghiên cứu về trí tuệ nhân tạo của Viettel.
Phóng viên báo Nhân Dân đã có buổi trò chuyện với người đứng đầu Viettel Cyberspcae về quá trình phát triển trí tuệ nhân tạo (AI) tại Việt Nam.
PV: Chỉ 3 tháng sau khi ra mắt, ChatGPT đã trở thành một hiện tượng toàn cầu. Từ góc độ của một chuyên gia, ông đánh giá thế nào về ưu và nhược điểm của chatbot này?
Ông Nguyễn Mạnh Quý: Cuối năm 2022, ChatGPT được OpenAI tung ra để người dùng trải nghiệm. Đây là chatbot đầu tiên có thể trả lời được nhiều câu hỏi của người dùng với kiến thức rộng và cách trả lời tự nhiên.
Với Google, nếu người dùng tìm kiếm điều gì đó công cụ này sẽ trả lại hàng nghìn đường link để tham khảo. Còn ChatGPT sẽ tổng hợp nhiều nguồn dữ liệu rồi tóm tắt, cô đọng thành một câu trả lời duy nhất.
ChatGPT giống như muốn cuốn bách khoa toàn thư, hay như người Việt Nam chúng ta thường gọi là một Biết tuốt vậy.
Ngôn ngữ tự nhiên là phần khó nhất của trí tuệ nhân tạo. Do vậy, khả năng tương tác với con người một cách tự nhiên chính là ưu điểm lớn nhất của ChatGPT. Ưu điểm này đã tạo ra sự bùng nổ và dấy lên một cuộc chiến mới giữa các Big Tech về trí tuệ nhân tạo.
Về nhược điểm, do quá trình huấn luyện có thể mất cả năm trời nên dữ liệu của ChatGPT sẽ không được cập nhật ngay như là Google. Chẳng hạn, nếu bạn hỏi những thông tin mang tính tức thời như thời tiết trong ngày thì ChatGPT sẽ khó có thể trả lời được. Bởi dữ liệu của mô hình này chỉ được cập nhật từ năm 2021 trở về trước.
ChatGPT có thể học từ các nguồn trên Internet hoặc đối thoại với người dùng. Nếu các dữ liệu được nhập vào là tin giả (fake news), ChatGPT có thể trả lời sai.
Do vậy người dùng phải cẩn thận trong việc sử dụng nội dung. Dữ liệu hỏi đáp trong tiếng Việt chưa nhiều nên sẽ sai nhiều. Tôi khuyến nghị người dùng sử dụng tiếng Anh để hỏi đáp và học tập kiến thức mới.
PV: ChatGPT đã có khả năng hỗ trợ con người làm nhiều việc như viết luận, dịch thuật, tóm tắt, cô đọng nhiều dữ liệu,… Vậy, khi đủ thông minh một trí tuệ nhân tạo có khả năng đe dọa hay thậm chí là thay thế nguồn nhân lực truyền thống không, thưa ông?
Ông Nguyễn Mạnh Quý: Khi một cuộc cách mạng xảy ra, chúng ta thường lo lắng nhiều người sẽ mất việc làm. Nhưng lịch sử nhân loại đã chứng kiến: cuộc cách mạng công nghiệp lần thứ nhất, lần thứ hai, lần thứ ba và đây là cuộc cách mạng lần thứ tư.
Tôi nghĩ đó là sự phát triển tất yếu. Sự phát triển này sẽ sản sinh ra các công việc mới. Giống như việc chúng ta làm gì có nghề lập trình khi động cơ hơi nước còn được dùng trong cuộc cách mạng công nghiệp lần thứ nhất! Điều quan trọng là chúng ta phải cập nhật kiến thức để thích ứng.
Tôi cho rằng AI chưa thể thay thế con người được. AI sẽ chỉ hỗ trợ con người nhiều hơn, giúp công việc hiệu quả hơn, năng suất hơn.
Bản chất của AI là dựa trên thuật toán học sâu (deep learning), tức là, học bằng 1 nguồn dữ liệu rất lớn. Con người tạo ra dữ liệu gì thì AI học dữ liệu đó.
AI thì có thể làm thơ nhưng phải dựa trên những dữ liệu có sẵn chứ không thể làm thơ từ cảm xúc được. Con người có khả năng trừu tượng hóa và tư duy ra các khái niệm mới. Con người có cảm xúc. Tôi nghĩ đó là hai điều khác biệt mà AI chưa thể thay thế được. AI vẫn là máy móc thôi.
Ví dụ như hôm nay tôi ra lệnh cho ChatGPT viết một bài báo để đăng trên Báo Nhân Dân, tôi vẫn phải có một ý tưởng. Sau đó, chúng ta vẫn phải hiệu chỉnh để bài báo hay hơn. Do vậy, chúng ta vẫn cần tới sự cộng tác giữa người và máy, người và AI.
PV: Một số công ty lớn như Big Tech đã đầu tư bài bản vào AI để tạo ra các nền tảng nhưng lại chưa đi vào các ngành cụ thể. Ông lý giải việc này như thế nào? Đây có phải là cơ hội cho doanh nghiệp Việt Nam tìm ra cách thức riêng để phát triển AI cho thị trường trong nước hoặc địa phương hóa những AI có sẵn cho phù hợp với Việt Nam?
Ông Nguyễn Mạnh Quý: Các công ty trí tuệ nhân tạo trên thế giới chia làm hai loại: Một là các công ty lớn như Big Tech. Hai là các công ty nhỏ tích hợp AI vào các ứng dụng cụ thể.
Loại thứ nhất thường sẽ cung cấp các nền tảng lớn hay các công nghệ lõi. Loại thứ hai sẽ tích hợp AI vào các ứng dụng cụ thể như: Y tế (các AI để chuẩn đoán bệnh hoặc xem X-quang,…), giao thông (các AI liên quan đến camera giao thông, nhận diện biển số xe, nhận diện người đi bộ, nhận diện tai nạn giao thông,…), tài chính (các AI đánh giá điểm tín dụng giúp người dùng vay nhanh hơn,…).
AI là một lĩnh vực rất rộng và không ai có thể làm hết được. Việt Nam nên địa phương hóa các AI có sẵn. Tôi lấy thí dụ về một việc phát triển mô hình xe tự lái của Mỹ ở Việt Nam: Xe tự lái chạy ở Mỹ thì khác với Việt Nam. Bởi Việt Nam có cả xe máy, xe đạp,… Hành vi lái xe ở Việt Nam cũng khác với Mỹ. Nên để ứng dụng một chiếc xe tự lái ở Mỹ tại Việt Nam, kiểu gì cũng phải địa phương hóa.
Đây là cơ hội để Việt Nam hợp tác với các Big Tech để địa phương hóa hoặc cá thể hóa các AI tầm cỡ dựa trên dữ liệu bản địa và hành vi người dùng của Việt Nam. Các phiên bản địa phương hóa này sẽ giúp người dùng có trải nghiệm chính xác hơn, tin cậy hơn.
PV: Vậy Việt Nam đã và đang phát triển trí tuệ nhân tạo như thế nào? Viettel Cyberspace đã đạt được những dấu mốc gì trên con đường này, thưa ông?
Ông Nguyễn Mạnh Quý: Năm 2007, tôi bắt đầu theo học ngành thị giác – một nhánh của trí tuệ nhân tạo tại Đại học Thanh Hoa (Trung Quốc). Năm 2010, tôi về nước. Lúc đó, các ứng dụng trí tuệ nhân tạo tại Việt Nam chưa có nhiều. Theo tôi hiểu, ngay cả những người làm trong lĩnh vực kỹ thuật thì cũng chưa thực hiểu về khái niệm này lắm.
Năm 2012, thuật toán học sâu (deep learning) ra đời tạo ra sự đột phá cho trí tuệ nhân tạo trên thế giới, bao gồm Việt Nam.
Thực ra trí tuệ nhân tạo gắn liền với một xu thế lớn hơn. Đó là cuộc cách mạng công nghiệp 4.0 và chuyển đổi số. Theo một báo cáo do Viettel Cyberspace thực hiện, 92% ứng dụng của chuyển đổi số có liên quan tới ứng dụng của trí tuệ nhân tạo và phân tích dữ liệu.
Thí dụ, khi xây dựng thành phố thông minh - chuyển đổi số, chúng ta cần lắp hệ thống camera giao thông, hàng trăm chiếc. Nếu không có trí tuệ nhân tạo, chúng ta sẽ cần bao nhiêu người ngồi nhìn hàng trăm cái camera đó? Trong khi trí tuệ nhân tạo hoàn toàn có thể tự xem và hiểu các hành vi vi phạm giao thông và đưa ra các cảnh báo.
Quay trở lại câu hỏi: Tại sao trí tuệ nhân tạo phát triển? Vì trí tuệ nhân tạo chính là cốt lõi của chuyển đổi số. Quá trình chuyển đổi số được thúc đẩy là ưu điểm lớn nhất của Việt Nam.
Hiện tại, Viettel Cyberspace đang nghiên cứu phát triển AI với 3 lĩnh vực chính: Xử lý tiếng nói, ngôn ngữ tự nhiên; thị giác máy tính và phân tích dữ liệu.
Về công nghệ xử lý tiếng ồn nói và ngôn ngữ tự nhiên: Viettel Cyberspace đã phát triển các dòng sản phẩm trợ lý ảo tương tác bằng tiếng Việt.
Mô hình này tương tự như ChatGPT nhưng nhỏ hơn. Trong khi GPT-3 thì được huấn luyện vởi khoảng 175 tỷ tham số, ChatGPT được với 1,5 tỷ tham số thôi, chúng tôi cũng đang huấn luyện mô hình với khoảng 500 triệu tham số.
Sự cách biệt trong tham số lớn như vậy nghĩa là còn cần rất nhiều tiền để đầu tư vào hạ tầng, để làm sạch và thu thập dữ liệu.
Tuy nhiên Viettel Cyberspace đã có siêu máy tính 20 PetaFlops (20 triệu tỷ phép tính/giây) nên thời gian huấn luyện máy học này giảm hàng chục lần so với trước đó. AI này có thể thông minh lên hàng tuần, hàng ngày.
Về công nghệ thị giác máy tính: Viettel Cyberspace đã và đang triển khai nhiều dự án thành phố thông minh. Việc này giúp Viettel có nhiều lợi thế trong việc triển khai các camera thông minh. Các camera này giống như mắt thần có thể nhận diện người và nhận diện phương tiện giao, hiểu được ngữ cảnh, phân tích các hành vi giúp cho việc giám sát giao thông thông minh và an ninh an toàn trong các thành phố.
Về công nghệ quản trị và phân tích dữ liệu: Viettel Cyperspace có sẵn lợi thế tiếp cận lượng dữ liệu khổng lồ ở trên mạng xã hội và không gian mạng từ khi thành lập.
PV: Thưa ông, vậy tại sao các quốc gia phải phát triển trí tuệ nhân tạo của chính mình thay vì chỉ địa phương hóa? Và với nhiều lợi thế rất lớn là hỗ trợ tiếng Việt, tại sao các trợ lý ảo của Việt Nam chưa phổ biến ngay với cả người Việt?
Ông Nguyễn Mạnh Quý: ChatGPT có khả năng ăn sâu vào cuộc sống, công việc của con người. Bạn thử tưởng tượng, với sức mạnh lan tỏa lớn như vậy, nếu ChatGPT trả lời sai một thông tin gì đó khiến nhiều người dùng có thể học bị sai, điều gì sẽ xảy ra?
Cho nên chúng ta phải làm chủ trí tuệ nhân tạo bằng việc tự phát triển và nghiên cứu. Việc này cũng giúp Việt Nam chủ động trong công nghệ và phát triển các ứng dụng, mà không bị phụ thuộc vào các đối tác nước ngoài.
Còn về việc trợ lý ảo bằng tiếng Việt chưa phổ biến với người Việt tôi có thể lý giải như thế này: Không giống như ChatGPT - một chatbot mang tính phổ cập, các trợ lý ảo của Việt Nam được ứng dụng theo các chuyên ngành hẹp.
Cụ thể, Viettel Cyberspace đã ứng dụng trợ lý ảo trong lĩnh vực truyền thông. Trợ lý ảo này chỉ trả lời về gói cước, dịch vụ di động, dịch vụ cáp,… Hay một trợ lý ảo trong lĩnh vực tài chính thì sẽ chỉ trả lời các câu hỏi về thẻ hay tài khoản ngân hàng,…
Điểm khác biệt với những chatbot phổ biến như ChatGPT là các trợ lý ảo chuyên ngành được huấn luyện dựa trên dữ liệu của khách hàng nên câu trả lời đưa ra phải chính xác tuyệt đối. Thông thường, các trợ lý ảo này thường không có tên cụ thể mà được tích hợp vào các trang web hay ứng dụng điện thoại của người dùng/doanh nghiệp.
Với nhóm khách hàng nhỏ và cá biệt như vậy, độ phổ biến của các trợ lý ảo của Việt Nam sẽ thấp hơn.
Tuy nhiên với sự phát triển bùng nổ của ChatGPT, Viettel Cyberspace cũng phải thay đổi cách tiếp cận: Thay vì chỉ phát triển các trợ lý ảo chuyên ngành hẹp, chúng tôi bắt đầu có kế hoạch phát triển các trợ lý ảo có chuyên ngành rộng.
ChatGPT khiến các bên phải mạnh dạn tham chiến hơn nữa hoặc mạnh dạn đưa các công nghệ của mình ra hơn. Viettel cũng vậy. Điều này sẽ giúp cho trí tuệ nhân tạo phát triển nhanh hơn.
PV: Theo ông, đâu là các yếu tố để phát triển AI tại Việt Nam và làm sao để AI Việt Nam có thể cạnh tranh với AI thế giới ngay trong thị trường nội địa?
Ông Nguyễn Mạnh Quý: Để phát triển AI cần có 3 trụ lớn: Siêu máy tính; dữ liệu lớn; thuật toán.
Mỗi lần huấn luyện bằng siêu máy tính sẽ rất tốn kém. Theo báo cáo, chỉ riêng tiền vận hàng mỗi tháng của ChatGPT đã là vài triệu USD. Còn chi phí huấn luyện gì là vài tỷ USD. Đây là một chi phí rất lớn để đưa những chatbot như ChatGPT vào ứng dụng.
Chiến lược chuyển đổi số quốc gia đã có quỹ đầu tư vào hệ thống siêu máy tính tại Việt Nam nhưng đó vẫn là một việc cần phải có lộ trình.
Bên cạnh đó, các công ty phát triển AI hàng đầu thế giới như Facebook, Google, Microsoft,... đều là những công ty có dữ liệu. Một ngày chúng ta ra vào Facebook cả chục lần, cứ thứ gì không biết thì lên Google,… Chính những hành vi đó đã cung cấp dữ liệu người dùng cho các ông lớn, từ đó họ có thể phát triển các thuật toán AI.
Tuy là các nền tảng nước ngoài nhưng họ sở hữu tất cả dữ liệu người dùng của Việt Nam.
Thuật toán là yếu tố Việt Nam có nhiều lợi thế. Trong trí tuệ nhân tạo, thuật toán là các công thức rất là phức tạp và ứng dụng rất nhiều công thức toán học. Hay nói cách khác, thuật toán chính là con người.
Việt Nam lại có một lực lượng mạnh về công nghệ thông tin và có nền tảng tốt về toán học. Bằng chứng là nhiều công ty phát triển AI của Nhật Bản hay Singapore đều đặt trụ sở tại Việt Nam để tận dụng nguồn nhân lực trong nước.
Trong phát triển trí tuệ nhân tạo thì con người cũng là một trong 3 yếu tố cốt lõi để phát triển. Nếu được đầu tư thêm vào hai trụ cột còn lại, Việt Nam hoàn toàn có thể trở thành trung tâm trí tuệ nhân tạo của Đông Nam Á.
Tổ chức sản xuất: Việt Anh
Thực hiện: Thi Uyên
Video: Trung Hiếu