Google công bố bước tiến mới với AI trong tìm kiếm, dịch thuật và bản đồ

Người dùng có thể đặt những câu hỏi ngắn hơn - hoặc thậm chí là không cần hỏi nhưng Google vẫn biết được chính xác người dùng đang cần gì hoặc hiển thị những điều bạn thấy hữu ích

Tại sự kiện Search On 2022, Google đã cho thấy sự tiến bộ của trí tuệ nhân tạo (AI) một lần nữa giúp Google cải tiến các sản phẩm của mình. "Gã khổng lồ" này khẳng định, không còn đơn thuần là một thanh tìm kiếm, Google đã sáng tạo ra một công cụ vận hành đa chiều như bộ não của con người.

"Chúng tôi đã hình dung về một thế giới nơi mọi người có thể tìm kiếm chính xác những gì họ cần bằng cách kết hợp hình ảnh, âm thanh, văn bản và giọng nói, giống như những gì chúng ta vẫn hay làm. Người dùng có thể đặt những câu hỏi ngắn hơn - hoặc thậm chí là không cần hỏi nhưng Google vẫn biết được chính xác người dùng đang cần gì hoặc hiển thị những điều bạn thấy hữu ích, cá nhân hóa việc khám phá thông tin của bản thân", Google cho biết.

Tìm kiếm hình ảnh trực quan hơn

Theo Google, hàng trăm năm qua, máy ảnh vẫn thường được nghĩ đến như là nơi lưu giữ kỷ niệm; hoặc với bối cảnh hiện nay, nhiều người dùng vẫn hay sử dụng nó để sáng tạo nội dung. Nhưng máy ảnh còn là thiết bị hữu ích để truy cập thông tin và hiểu thêm về thế giới xung quanh, thậm chí nếu gọi máy ảnh là bàn phím tiếp theo cũng không hề sai. Đó là lý do cho sự ra đời của Google Ống kính, nhằm giúp tìm kiếm thông qua máy ảnh hoặc hình ảnh. Hiện có hơn 8 triệu câu hỏi được trả lời mỗi tháng qua Google Ống kính.

Google vẫn tiếp tục làm việc để biến việc tìm kiếm qua hình ảnh trở nên tự nhiên hơn với Tìm kiếm đa dữ liệu - một cách hoàn toàn mới, để tìm kiếm bằng cách sử dụng đồng thời cả hình ảnh và văn bản, tương tự như cách một người tò mò về một thứ gì đó và đặt câu hỏi với bạn bè. Đầu năm nay, Google đã giới thiệu bản dùng thử tính năng Tìm kiếm đa dữ liệu ở Mỹ. Sau đó, tại sự kiện Search On 2022, Google đã thông báo về bản cập nhật hơn 70 ngôn ngữ.

"Tìm kiếm đa dữ liệu gần tôi” cũng được phát triển như một tính năng bổ trợ, cho phép người dùng Google chụp ảnh một vật không quen thuộc, như một món ăn hoặc một loại cây trồng, sau đó tìm thấy nó ở địa điểm gần đó. Google sẽ bắt đầu tung tính năng "Tìm kiếm đa dữ liệu gần tôi" bằng tiếng Anh ở Mỹ vào mùa thu này.

Google công bố bước tiến mới với AI trong tìm kiếm, dịch thuật và bản đồ - 1

Ảnh động minh họa cho biết cách người dùng có thể sử dụng ứng dụng Google để tìm kiếm, bằng cách sử dụng đồng thời hình ảnh và văn bản thông qua chụp ảnh và sau đó thêm văn bản vào truy vấn.

Hiểu cả thế giới qua công cụ dịch thuật

Bên cạnh đó, Google đã nỗ lực để hiện thực hóa việc “phiên dịch” hình ảnh trên Google Ống kính với sự tiến bộ của trí tuệ nhân tạo AI.

Hiện, người dùng đang sử dụng Google để phiên dịch văn bản trên hình ảnh hơn 1 tỉ lần mỗi tháng với hơn 100 ngôn ngữ khác nhau, để có thể đọc thông tin ở mặt tiền cửa hàng, menu, bảng hiệu,... Nhưng đôi khi, ý nghĩa lại thay đổi tùy thuộc vào ngôn ngữ và ngữ cảnh sử dụng.

Thay vì chỉ đơn thuần che đi văn bản gốc, Google đã có thể tái tạo các điểm ảnh nhằm cho ra một hình nền khớp với nguyên bản, và đặt bản phiên dịch lên phần hình nền đó để cho ra một giao diện trông tự nhiên hơn thông qua công nghệ máy học (machine learning) có tên là mạng đối nghịch tạo sinh (Generative Adversarial Networks - còn được biết đến là GANs). Ví dụ: Nếu người dùng đưa máy ảnh đến một tạp chí ở ngôn ngữ khác, họ sẽ thấy phần văn bản được dịch đặt trên một ảnh nền phía sau.

Khám phá thế giới với chế độ xem đắm chìm

Bên cạnh đó, Google đang đưa những cải tiến mới nhất từ công nghệ thị giác máy tính (computer vision) và mô hình dự đoán (predictive models) vào ứng dụng Bản đồ. Cụ thể hơn, bản đồ 2D sẽ được nâng cấp thành chế độ xem đa chiều, cho phép người dùng hòa mình với không gian tưởng chừng như họ đang thực sự ở đó.

Sau thành công của tính năng cập nhật tình hình giao thông trực tiếp trên Google Maps, Google đã tạo ra một nâng cấp đáng kể khác trong việc lập bản đồ, như thông tin thời tiết và mức độ đông đúc của một địa điểm với chế độ xem đắm chìm trong Google Maps. Qua trải nghiệm mới này, người dùng có thể cảm nhận sơ bộ về một địa điểm trước khi đến, từ đó tự tin hơn khi quyết định nên đi đâu và vào thời gian nào.

Google đang mở rộng phiên bản mới này với cảnh quan trên không của 250 địa danh, và chế độ xem đắm chìm sẽ đến với năm thành phố lớn khác trong những tháng tới. Nhiều địa danh khác cũng đang được nghiên cứu để triển khai.