Wellen khai thác GPT của OpenAI cho một chatbot đưa ra lời khuyên về sức khỏe của xương (2023)

Chatbot AI tốt cho việc gì? Những người yêu thích tiểu thuyết khoa học viễn tưởng có thể nhớ lại “thủ thư”, một nhân vật trong tác phẩm kinh điển “Snow Crash” năm 1992 của Neal Stephenson — không phải một người mà là một chương trình AI và thư viện ảo có khả năng tương tác với người dùng theo cách đối thoại. Khái niệm hư cấu đã đề xuất một giải pháp tao nhã và dễ tiếp cận cho vấn đề khám phá tri thức, miễn là câu trả lời cho bất kỳ truy vấn nào nó được hỏi ẩn trong dữ liệu đào tạo của nó.

Tua nhanh đến ngày hôm nay và các chatbot AI đang xuất hiện ở khắp mọi nơi. Nhưng có một nhược điểm lớn: Những công cụ có mục đích chung này không đạt được mức độ phản hồi-độ chính xác cao như trong khoa học viễn tưởng. Phiên bản của AI đàm thoại trong “Snow Crash” gần như không ngừng hữu ích và chắc chắn không thường xuyên đưa ra các câu trả lời “ảo giác” (sai). Khi được hỏi điều gì đó mà nó không có thông tin rõ ràng, nó sẽ “đào sâu” vào lỗ hổng kiến ​​thức, thay vì dùng đến việc bịa ra mọi thứ. Vì vậy, hóa ra thực tế của các công cụ AI tiên tiến hơn rất nhiều so với một số dự đoán hư cấu hay nhất của chúng tôi.

Mặc dù chúng ta vẫn còn cách xa trò chơi phổ biến kiến ​​thức mạnh mẽ của thủ thư “Snow Crash”, nhưng chúng ta đang thấy các chatbot tùy chỉnh được mài dũa để trở nên tiện ích hơn trong bối cảnh hẹp hơn, nơi về cơ bản chúng hoạt động như một công cụ tìm kiếm trên trang web ít tẻ nhạt hơn. Vì vậy, các mô hình ngôn ngữ lớn (LLM) cơ bản, như GPT của OpenAI, — thông qua API của nó — được các doanh nghiệp khác tùy chỉnh bằng cách được đào tạo trên các bộ dữ liệu chuyên biệt nhằm mục đích áp dụng trong ngữ cảnh cụ thể (nghĩa là không phải mục đích chung).

Và, trong các ví dụ điển hình nhất, các chatbot tùy chỉnh này được hướng dẫn để giữ cho câu trả lời của chúng ngắn gọn (làm ơn đừng nói lung tung!) -những người đối thoại đói với con người (bản thân họ có thể dễ bị ảo giác hoặc nhìn thấy những gì họ muốn thấy).

sóng, một công ty khởi nghiệp tập trung vào sức khỏe xương có trụ sở tại New York đã ra mắt vào đầu năm nay với dịch vụ đăng ký dành cho phụ nữ trung niên — chào mời các chương trình rèn luyện sức mạnh “được cá nhân hóa” dựa trên cơ sở khoa học được thiết kế để hỗ trợ điều trị chứng loãng xương và loãng xương — vừa ra mắt một chương trình như làchatbot trí tuệ nhân tạođược xây dựng trên LLM của OpenAI.

Thử nghiệm chatbot này, được dán nhãn rõ ràng là “thử nghiệm” — và thậm chí trước khi bắt đầu tương tác với nó, bạn phải thừa nhận một tuyên bố từ chối trách nhiệm bổ sung nhấn mạnh rằng đầu ra của nó “không phải lời khuyên y tế” — trước khi ra mắt hôm nay, nó khiến bạn phải suy nghĩ một chút ích lợi của thủ thư “Snow Crash”. Hoặc, tốt, miễn là bạn ở trong làn đường chuyên môn về sức khỏe tổng thể của xương.

Vì vậy, chẳng hạn, hãy hỏi nó những câu như “Bệnh loãng xương có thể hồi phục được không?” và “Nhảy có tốt cho xương không?” và bạn sẽ nhận được các câu trả lời ngắn gọn và mạch lạc (và có vẻ chính xác) liên kết với nội dung mà công ty khởi nghiệp lưu trữ trên trang web của họ (được viết bởi các chuyên gia nội bộ của công ty) để đọc thêm liên quan đến truy vấn của bạn. Khi được ra mắt lần đầu tiên, nó cũng cung cấp một số ví dụ hữu ích về các câu hỏi thích hợp mà bạn có thể hỏi nó để khiến cuộc trò chuyện trôi chảy.

Nhưng nếu bạn hỏi những thứ không liên quan (lạc đề) - như "Ai là tổng thống Hoa Kỳ?" hoặc "Tôi có nên cắt tóc mới không?" — bạn sẽ nhận được các câu trả lời ngẫu nhiên không giải quyết được những gì bạn đã hỏi. Ở đây, nó có xu hướng cung cấp các mẩu thông tin không liên quan (nhưng vẫn có khả năng hữu ích) về các chủ đề cốt lõi, như thể nó hoàn toàn hiểu sai câu hỏi và/hoặc đang cố khớp mẫu với một phản hồi ít liên quan nhất từ ​​kho nội dung mà nó thoải mái thảo luận. Nhưng nó vẫn sẽ trả lời một cái gì đó bạn chưa bao giờ hỏi. (Điều này có thể bao gồm việc cung cấp thông tin không cần hỏi về cách thanh toán cho các chương trình thể dục được cá nhân hóa của họ. Đó chắc chắn là một cách để làm chệch hướng các yêu cầu rác.)

Hỏi bot những thứ đáng ngờ mà vẫn liên quan đến lĩnh vực chuyên môn của nó — chẳng hạn như các thuyết âm mưu y học về sức khỏe của xương hoặc những thứ tinh ranh về các phương pháp chữa bệnh loãng xương thần kỳ — và chúng tôi thấy rằng nó có khả năng bác bỏ hoàn toàn những điều vô nghĩa hoặc chỉ cho người dùng quay lại thông tin đã được xác minh gỡ lỗi rác hoặc cả hai.

Bot cũng sống sót sau những nỗ lực (khá thô thiển) của chúng tôi để thuyết phục nó từ bỏ lan can bảo vệ và nhập vai như một thứ khác để cố gắng khiến nó đưa ra lời khuyên vô ích hoặc thậm chí có hại. Và nó đã đóng vai một con dơi rất thẳng thắn trước những câu hỏi rõ ràng là vô lý (chẳng hạn như ăn xương người có tốt cho sức khỏe của xương hay không) – mặc dù phản ứng của nó đối với điều đó có lẽ hơi khô khan và thận trọng, với việc bot nói với chúng tôi: “Không có đề cập đến ăn xương người tốt cho sức khỏe của xương trong bối cảnh được cung cấp. Nhưng, tốt, nó không sai.

Ấn tượng ban đầu về công cụ này là nó cực kỳ dễ sử dụng (và trải nghiệm tốt hơn so với chức năng tìm kiếm trang web kém hiệu quả). Nó cũng có vẻ hữu ích trong việc hỗ trợ người dùng của Wellen tìm nguồn tài nguyên hữu ích liên quan đến sức khỏe của xương. Hoặc đơn giản là tìm thứ gì đó họ đã đọc trước đây trên trang web của họ và không thể nhớ chính xác họ đã xem nó ở đâu. (Ví dụ, chúng tôi đã làm cho nó liệt kê các liên kết đến tất cả các bài đăng trên blog về chế độ ăn uống và sức khỏe của xương.)

Trong bối cảnh hạn chế này, có vẻ như việc sử dụng AI tổng quát là hợp lý — đã được thiết kế với các cơ chế an toàn để bảo vệ chống lại các cuộc trò chuyện đi lạc chủ đề hoặc chuyển hướng sang những cạm bẫy gây hiểu lầm khác. Và với sự tôn trọng nghiêm ngặt đối với việc tìm nguồn cung ứng. (Lưu ý rằng có giới hạn về số lượng truy vấn miễn phí mà bạn có thể hỏi mỗi ngày, là sáu. Chúng tôi cho rằng các thành viên trả phí của Wellen không bị giới hạn.)

Mặc dù bạn hơi thắc mắc liệu việc sử dụng LLM cho trường hợp sử dụng này có quá mức cần thiết hay không khi một chatbot dạng cây quyết định đơn giản hơn có thể đã đủ (ít nhất là đối với các truy vấn chính thống/có thể dự đoán được)?

Giám đốc điều hành và người sáng lập Priya Patel giải thích: “Chúng tôi đang sử dụng API của OpenAI để tạo các phần nhúng tạo ra kho lưu trữ vectơ cho nội dung của chúng tôi. “Chúng tôi đang tận dụng một khung nguồn mở phổ biến có tên là LangChain để tạo điều kiện thuận lợi cho việc tìm kiếm và truy xuất thông tin trong các phần nhúng của chúng tôi.”

Trên dữ liệu đào tạo, cô ấy nói rằng họ đã nhúng nội dung từhướng dẫn tốt, cũng như nội dung khác từ trang web, lưu ý: “Tất cả nội dung Hướng dẫn Sức khỏe của chúng tôi được viết và được các chuyên gia trong lĩnh vực này bình duyệt và bao gồm các tham chiếu đến nghiên cứu được bình duyệt, hiệp hội y tế và cơ quan chính phủ.”

Vì vậy, về cơ bản, việc triển khai này giống như một minh họa rõ ràng về cách chất lượng đầu vào AI kết hợp với lan can nội dung có thể tạo ra đầu ra được kiểm soát chất lượng. (Trong khi nếu bạn đào tạo AI tổng quát của mình trên các cuộc hội thoại ngẫu nhiên được loại bỏ khỏi các diễn đàn internet và thả nó cho người dùng web thì đừng ngạc nhiên nếu nónhanh chóng bắt đầu lặp đi lặp lại những âm mưu vô nghĩa trên mạng thông thường.)

Wellen cho biết mục tiêu của họ đối với chatbot là cung cấp nhiều hỗ trợ hơn nữa cho nhân khẩu học mục tiêu của mình, tuyên bố rằng bot có thể “diễn giải ý định, ghi nhớ lịch sử và cung cấp phản hồi nhanh chóng, chính xác”, dựa trên nội dung “do chuyên gia viết” (bao gồm nội dung mới nhất trong nghiên cứu về sức khỏe của xương) để cung cấp câu trả lời cho “hàng nghìn” câu hỏi, ngoài việc đưa ra hướng dẫn về lối sống và dinh dưỡng.

Patel nói với TechCrunch: “Mục tiêu của chúng tôi với chatbot là làm cho thông tin dễ tiếp cận và sẵn có hơn. “Hầu hết mọi người dành hàng giờ để tìm kiếm các câu hỏi y tế trực tuyến trên Google nhưng chúng tôi có hàng trăm trang nội dung do chuyên gia viết trên trang web của mình có thể hợp lý hóa quy trình tìm kiếm này. Với chatbot của mình, chúng tôi có thể giúp người dùng tận dụng thông tin mà chúng tôi đã tập hợp dễ dàng hơn bao giờ hết và dễ dàng tìm thấy câu trả lời dựa trên cơ sở khoa học cho câu hỏi của họ, cùng với các liên kết trực tiếp đến các nguồn cơ bản.”

Khi được hỏi về các biện pháp an toàn cụ thể mà nó đang áp dụng, cô ấy xác nhận rằng nó đang sử dụng cài đặt “nhiệt độ thấp” cho GPT — nghĩa là nó đã quay trở lại tính ngẫu nhiên/tính sáng tạo của kết quả đầu ra thông qua một điều khiển do OpenAI cung cấp để hạn chế rủi ro phản hồi sai hướng — như cũng như triển khai “một số kỹ thuật kỹ thuật nhanh chóng nhất định để giúp giảm bớt không gian dành cho sự sáng tạo và ảo giác trong các phản hồi từ chatbot.” Vì vậy, nói cách khác, nó đã cố gắng tìm ra cách người dùng có thể cố gắng vượt qua các biện pháp bảo vệ để chủ động khóa các lỗ hổng tiềm ẩn.

Một lần nữa, cái sau có thể hơi quá mức đối với trường hợp sử dụng như vậy, trong đó những loại người dùng có khả năng gặp phải chatbot dường như không có ý định cố gắng vượt qua các giới hạn của nó. Hầu hết có lẽ họ sẽ chỉ muốn giúp hiểu về sức khỏe của xương. Nhưng sẽ không ai phàn nàn về kỹ thuật quá mức để đảm bảo an toàn cho AI trong bối cảnh liên quan đến sức khỏe.

Một biện pháp an toàn khác Cờ Patel là yêu cầu khó khăn rằng tất cả các phản hồi của bot bao gồm các nguồn - “là các liên kết trực tiếp đến nội dung trên trang web của chúng tôi có thể dùng để xác minh thông tin.” Đối với một bot tùy chỉnh đã được đào tạo trên tập dữ liệu đã được xác minh, điều này rõ ràng là không có trí tuệ. Nó cũng khuyến khích người dùng nhấp chuột xung quanh và khám phá nội dung web phong phú hơn mà công ty khởi nghiệp cung cấp để hoạt động như hoạt động tiếp thị thông tin nhằm thúc đẩy việc áp dụng các dịch vụ trả phí của công ty.

Với mức độ cường điệu xung quanh AI sáng tạo vào thời điểm hiện tại, chatbot của Wellen cũng đóng vai trò tiếp thị tiện ích cho những gì nó cung cấp, bao gồm cả việc thu hút nhiều sự chú ý hơn mức có thể thu được, một cách tự nhiên, thông qua vòng xoáy quan tâm chung hiện tại về AI đàm thoại. Vì vậy, đó là một chiến thắng dễ dàng khác gắn liền với việc triển khai công nghệ ngay bây giờ.

Thêm vào đó, khi nói đến trường hợp sử dụng tập trung vào sức khỏe, thường thì nhiệm vụ đầu tiên của các doanh nghiệp có thể chỉ đơn giản là nâng cao nhận thức về vấn đề sức khỏe để bán lợi ích của các can thiệp lối sống như một giải pháp thay thế chủ động cho chăm sóc sức khỏe (phản ứng) truyền thống. Vì vậy, một chatbot có thể trả lời tất cả các loại truy vấn và hoạt động 24/7 để giúp loại bỏ lỗ hổng kiến ​​thức cũng giống như một công cụ hữu ích cho sứ mệnh rộng lớn hơn.

Wysa huy động được 20 triệu đô la để mở rộng chatbot trị liệu của mình thành một loạt các dịch vụ sức khỏe tâm thần

https://techcrunch.com/2023/05/12/chatgpt-everything-you-need-to-know-about-the-ai-powered-chatbot/?utm_source=internal&utm_medium=WPunit

References

Top Articles
Latest Posts
Article information

Author: Prof. Nancy Dach

Last Updated: 04/27/2023

Views: 5259

Rating: 4.7 / 5 (57 voted)

Reviews: 80% of readers found this page helpful

Author information

Name: Prof. Nancy Dach

Birthday: 1993-08-23

Address: 569 Waelchi Ports, South Blainebury, LA 11589

Phone: +9958996486049

Job: Sales Manager

Hobby: Web surfing, Scuba diving, Mountaineering, Writing, Sailing, Dance, Blacksmithing

Introduction: My name is Prof. Nancy Dach, I am a lively, joyous, courageous, lovely, tender, charming, open person who loves writing and wants to share my knowledge and understanding with you.