Apple ra mắt công nghệ AI tiên tiến vượt trội so với GPT-4: Bí mật đằng sau thành công!


Hôm nay, Apple đã chính thức giới thiệu mô hình AI mới mang tên ReALM, với khả năng xử lý nhanh hơn GPT-4. Thông tin về ReALM xuất hiện sau khi có tin đồn về việc hợp tác của Apple với Google và OpenAI để phát triển công nghệ AI. ReALM sẽ được trình bày tại hội nghị WWDC 2024 vào tháng 6, với các tính năng mới như hiểu bối cảnh tham chiếu khác nhau, chuyển đổi hình ảnh thành văn bản và tương tác đàm thoại tự nhiên hơn.

Nhóm nghiên cứu ReALM khẳng định rằng AI này sẽ hiệu quả hơn GPT-4 trong việc đồng nhất dữ liệu theo ngữ cảnh. Mặc dù còn một số hạn chế, nhưng ReALM hứa hẹn đem lại những lợi ích to lớn cho người dùng, đặc biệt là với trợ lý giọng nói Siri.

Apple đã đạt được những cải tiến đáng kể với ReALM, với việc tối ưu hóa số tham số để nâng cao hiệu suất mà không cần sử dụng quá nhiều tài nguyên. ReALM có thể là bước đột phá trong công nghệ AI và mang lại trải nghiệm tốt hơn cho người dùng trong tương lai.

#Apple #AI #ReALM #GPT4 #WWDC2024 #ChatGPTAI #OpenAI #Google #Siri

Thông tin về ReALM (Reference Resolution As Language Modeling) xuất hiện không lâu sau khi có thông tin tiết lộ rằng Apple có thể hợp tác với Google để tích hợp Gemini vào iOS 18 và tổ chức các cuộc đàm phán với OpenAI – công ty đã tạo ra ChatGPT. Ngoài ra, nhà sản xuất iPhone cũng đã mua lại hàng loạt startup liên quan đến ngành AI.

Apple giới thiệu mô hình AI nhanh hơn GPT-4- Ảnh 1.

ReALM chính là câu trả lời của Apple đối với ChatGPT

Các nhà phát triển ReALM cho biết mô hình AI này sẽ nhanh và hiệu quả hơn so với ChatGPT trong một số hoạt động. ReALM sẽ được trình bày chính thức tại hội nghị các nhà phát triển WWDC 2024 diễn ra vào tháng 6 với hứa hẹn có khả năng hiểu bối cảnh tham chiếu khác nhau của các yếu tố hình ảnh trên màn hình, chuyển đổi hình ảnh thành văn bản, tạo ra các tương tác đàm thoại và tự nhiên hơn với trợ lý giọng nói.

Nhóm nghiên cứu ReALM xác nhận AI này nhanh và hiệu quả hơn GPT-4 trong quá trình đồng hóa dữ liệu theo ngữ cảnh. Ngoài ra, họ muốn phổ biến một số nguyên tắc cơ bản trong việc phát triển mô hình ngôn ngữ của mình. Đại diện nhóm cho biết: “Có thể hiểu ngữ cảnh, bao gồm cả tài liệu tham khảo, là điều cần thiết đối với một trợ lý đàm thoại. Điều này cho phép người dùng đặt câu hỏi về những gì họ nhìn thấy trên màn hình, trở thành bước quan trọng để đảm bảo trải nghiệm rảnh tay trong trợ lý giọng nói”.

Được biết, máy tính không thể giải thích hình ảnh giống như cách con người có thể làm được, tuy nhiên Apple đã tìm ra giải pháp với ReALM với khả năng tái cấu trúc toàn bộ bối cảnh của màn hình thành văn bản. Mô hình này hứa hẹn cho hiệu suất tương tự GPT-4 bằng cách sử dụng ít tham số hơn, nhưng hiệu quả hơn nhờ việc tăng các thông số của nó.

“Chúng tôi đã chứng minh những cải tiến lớn so với hệ thống hiện có với chức năng tương tự trên nhiều loại tài liệu tham khảo khác nhau, trong đó mô hình nhỏ của chúng tôi đạt được mức cải thiện 5% về số tài liệu tham khảo trên màn hình. Các mô hình lớn hơn hoạt động tốt hơn đáng kể so với GPT-4”, nhóm phát triển cho biết.

Mặc dù vậy, Apple vẫn còn rất nhiều việc phải làm phía trước do ReALM có những hạn chế khi quản lý các tài liệu tham khảo trực quan phức tạp hơn khi cần phân biệt giữa nhiều hình ảnh. Với kết quả ban đầu, ReALM sẽ rất hứa hẹn và có thể khiến Siri cũng như các thành phần khác trong hệ điều hành của Apple có thể mang lại những lợi ích to lớn cho người dùng.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *