Trang chủ»Khoa học - Công nghệ»Khoa học & Công nghệ thế giới

Khoa học & Công nghệ thế giới

Mô hình trí tuệ nhân tạo mới của MIT dự đoán hành vi con người với sự chính xác đến kỳ lạ

Một kỹ thuật mới có thể được sử dụng để dự đoán hành động của con người hoặc tác nhân AI (trí tuệ nhân tạo), xử lý dưới mức tối ưu trong khi thực hiện những mục tiêu chưa xác định.



Các nhà nghiên cứu tại MIT và Đại học Washington đã phát triển một phương pháp mới để mô hình hóa hành vi ra quyết định của các tác nhân, liên quan đến các ràng buộc máy tính. Mô hình này có thể dự đoán các hành động trong tương lai từ hành vi trong quá khứ, nhằm mục đích cải thiện sự hợp tác của hệ thống AI với con người thông qua việc hiểu và thích ứng với những điểm bất hợp lý cũng như quá trình ra quyết định của con người - Ảnh: SciTechDaily.com

MIT cùng các nhà nghiên cứu khác đã phát triển một khung mô hình hóa hành vi phi lý hoặc dưới mức tối ưu của một con người hoặc tác nhân AI, dựa trên các ràng buộc tính toán. Phương pháp này có khả năng dự đoán những hành động tương lai của một tác nhân trong các tình huống như trong một trận cờ vua.

Để xây dựng các hệ thống trí tuệ nhân tạo có khả năng tương tác hiệu quả với con người, việc có một mô hình chuẩn xác ngay từ ban đầu là điều cần thiết. Nhưng con người thường có xu hướng đưa ra các quyết định dưới mức tối ưu.

Khó khăn trong việc mô hình hóa sự bất hợp lý này đã được làm rõ, do các ràng buộc tính toán hiện tại còn hạn chế. Con người không thể dành hàng thập kỷ để nghĩ về một giải pháp lý tưởng cho một vấn đề.

Phát triển phương pháp tiếp cận mô hình mới

Các nhà nghiên cứu tại MIT và Đại học Washington đã phát triển một phương pháp để mô hình hóa hành vi của một tác nhân, bất kể là con người hay máy móc và giải thích rằng các ràng buộc tính toán chưa xác định có thể gây trở ngại cho khả năng giải quyết vấn đề của các tác nhân.

Mô hình của nhóm nghiên cứu có thể tự động suy diễn các ràng buộc trên máy tính của tác nhân thông qua việc quan sát những dấu vết của các hành động trước đó. Kết quả là tác nhân có thể sử dụng những gì được gọi là “ngân sách suy luận” để dự đoán hành vi tương lai của chính nó.

Ứng dụng thực tế và thẩm định mô hình

Trong một bài báo mới, các nhà nghiên cứu đã trình bày cách mà mô hình của họ có thể được sử dụng để suy ra mục tiêu điều hướng của một người từ các nước đi trước đó để dự đoán các nước đi tiếp theo trong một trận cờ vua. Kỹ thuật này phù hợp và vượt trội hơn phương pháp phổ biến khác để mô hình hóa kiểu ra quyết định này.

Về mặt cơ bản, công trình này có thể giúp các nhà khoa học dạy các hệ thống AI về cách con người cư xử, từ đó tăng khả năng phản ứng đối với đối tác con người. Athul Paul Jacob, sinh viên tốt nghiệp ngành kỹ thuật điện và khoa học máy tính (EECS) và tác giả chính của bài viết về kỹ thuật này, cho biết việc hiểu một hành vi của con người, sau đó suy luận ra mục tiêu từ hành vi đó có sẽ khiến trợ lý AI ngày càng hữu dụng.

“Nếu chúng ta nhận thức rằng con người không hoàn hảo, sau khi quan sát cách họ cư xử, tác nhân AI có thể can thiệp và đưa ra giải pháp tốt nhất hoặc thích ứng với điểm yếu mà đối tác con người hay mắc phải”, ông cho biết.

Bài báo được viết bởi Jacob cùng với Abhishek Gupta, trợ lý giáo sư tại Đại học Washington và Jacob Andreas, Phó giáo sư trong lĩnh vực Kỹ thuật Điện và Khoa học Máy tính và là thành viên của Viện Công nghệ và Trí tuệ nhân tạo (CSAIL). Nghiên cứu này sẽ được trình bày tại Hội nghị Quốc tế về Đại diện học tập.

Mô hình hành vi mẫu

Các nhà nghiên cứu đã và đang xây dựng các mô hình tính toán về hành vi con người trong nhiều thập kỷ. Các phương pháp tiếp cận trước đây cố gắng giải thích việc đưa ra quyết định dưới mức tối ưu bằng việc thêm nhiễu vào mô hình. Thay vì tác nhân luôn luôn chọn đúng, mô hình sẽ cho phép các tác nhân lựa chọn đúng với tỷ lệ 95%.

Tuy nhiên, những phương thức này đôi khi không nắm bắt thực tế rằng con người không phải lúc nào cũng cư xử dưới mức tối ưu theo cùng một cách.

Những người khác tại MIT cũng nghiên cứu các phương pháp hiệu quả hơn để lập kế hoạch và hình dung ra các mục tiêu trên việc đưa ra các quyết định dưới mức tối ưu.

Để xây dựng mô hình, Jacob và cộng sự của ông đã lấy cảm hứng từ các nghiên cứu trước về người chơi cờ. Họ nhận thấy rằng người chơi thường không giành nhiều thời gian để suy nghĩ trước khi đi những nước đi đơn giản và những người chơi giỏi hơn có khuynh hướng dành nhiều thời gian lên kế hoạch hơn những người chơi kém hơn trong một trận đấu.

“Sau cùng, chúng ta thấy được độ chuyên sâu của kế hoạch, một người nghĩ về vấn đề trong bao lâu, là một đại diện thật sự tốt về việc con người cư xử”, Jacob cho biết.

Họ xây dựng một khung mô hình có thể suy ra mức độ lập kế hoạch chuyên sâu của tác nhân từ các hành động trước đó và sử dụng thông tin đó để mô hình hóa quy trình ra quyết định của tác nhân.

Bước đầu tiên trong phương pháp này bao gồm việc chạy một thuật toán trong một thời gian nhất định để giải quyết vấn đề đang được nghiên cứu. Ví dụ, trong trường hợp nghiên cứu một trận đấu cờ, họ có thể để thuật toán chơi cờ chạy một số bước nhất định. Cuối cùng, nhà nghiên cứu có thể thấy được các quyết định mà thuật toán đã tạo ra ở mỗi bước.

Mô hình so sánh những quyết định này với các hành vi của một tác nhân đang giải quyết cùng vấn đề. Nó sẽ điều chỉnh với các quyết định của tác nhân với các quyết định của thuật toán và truy ra bước mà tác nhân dừng dự định.

Từ đó, mô hình có thể xác định suy luận của tác nhân hoặc tác nhân đó sẽ lập kế hoạch vấn đề này trong bao lâu. Họ có thể sử dụng suy luận để dự đoán tác nhân sẽ phản ứng như thế nào khi giải quyết một vấn đề tương tự.

Giải pháp khả diễn giải

Phương thức này có thể rất hiệu quả, cho phép các nhà nghiên cứu có thể truy cập toàn bộ quyết định được thực hiện bởi thuật toán giải quyết vấn đề mà không thực hiện thêm tác vụ nào. Loại khung mô hình có thể được áp dùng cho mọi vấn đề có thể giải quyết bằng các dạng thuật toán cụ thể.

“Theo tôi, điều gây ấn tượng nhất là khái niệm ngân sách suy luận rất dễ hiểu. Mọi người nói các vấn đề khó hơn cần nhiều sự tính toán hơn hoặc người giỏi hơn thì mất nhiều thời gian tính toán hơn. Khi chúng tôi lần đầu thực hiện điều này, chúng tôi không ngờ rằng thuật toán có thể xử lý các hành vi đó một cách tự nhiên”, Jacob cho biết.

Các nhà nghiên cứu đã thử nghiệm phương pháp tiếp cận của họ trong ba nhiệm vụ xây dựng mô hình khác nhau: suy ra mục tiêu điều hướng từ các nước cờ trước đó, dự đoán ý định giao tiếp của một người từ tín hiệu lời nói và dự đoán các nước đi tiếp theo trong các trận đấu cờ vua giữa hai người với nhau.

Phương pháp của họ phù hợp hoặc vượt trội so với phương pháp thay thế phổ biến trong mỗi thử nghiệm. Hơn nữa, các nhà nghiên cứu nhận thấy rằng mô hình hành vi con người của họ rất phù hợp với các thước đo về kỹ năng của người chơi (trong các trận đấu cờ vua) và độ khó của nhiệm vụ.

Trong tương lai, các nhà nghiên cứu muốn sử dụng phương pháp này để mô hình hóa quy trình lập kế hoạch trong các lĩnh vực khác, chẳng hạn như học tăng cường (một phương pháp thử và sai thường được sử dụng trong chế tạo robot). Về lâu dài, họ dự định tiếp tục xây dựng công việc này hướng tới mục tiêu lớn hơn là phát triển các cộng tác viên trí tuệ nhân tạo hiệu quả hơn.

Việt An
(Lược dịch)

SIU Review - số 138

Thông tin tuyển dụng

Thông tin cần biết

icon Giá vàng
icon Tỷ giá ngoại tệ
icon Chứng khoán