Trợ Lý Ảo Đang Phát Triển Như Thế Nào?

Trợ Lý Ảo Đang Phát Triển Như Thế Nào?

Thử đặt một câu hỏi: Với con người thì trong 3 công việc viết, đánh máy và nói thì chúng ta làm việc gì để tiết kiệm công sức nhất. Tất nhiên là Nói. Vì sao? Một người bình thường trong một phút có thể viết 30 từ, gõ 60 từ, nhưng có thể nói tới 150 từ. Vậy nên để tối ưu công việc  thì chúng ta sẽ tối ưu việc nói.

Sự phát triển nhanh chóng của AIhọc máy đã giúp phát triển công nghệ nhận dạng giọng nói, công nghệ này ngày càng đi sâu vào mọi lĩnh vực trong cuộc sống.

Từ những điều trên, cũng với những phân tích bên dưới, ta sẽ chứng minh một cách sinh động rằng tại sao công nghệ điều khiển giọng nói nên được coi là xu thế công nghệ hiện tại không chỉ bới những ông lớn về IT hay những người có niềm đam mê với AI mà các doanh nghiệp cũng đang ráo riết nâng cấp, tối ưu hệ thống bằng công nghệ giọng nói hay còn gọi là trợ lý ảo.

Trợ lý ảo là gì?

Trợ lý ảo (có thể được gọi là trợ lý kỹ thuật số, trợ lý giọng nói hay là trợ lý AI) là một ứng dụng lập trình hướng nhiệm vụ, nhận dạng giọng nói của con người và thực hiện các lệnh được phát âm bởi người dùng. Nền tảng của nó là AI và năng suất của nó dựa vào việc lưu trữ hàng triệu từhàng triệu cụm từ. Không giống như các thiết bị nhận dạng giọng nói đầu tiên mà các nhà khoa học đang nghiên cứu vào những năm 40-50 của thế kỷ trước, các trợ lý kỹ thuật số hiện đại không bị hạn chế bởi một mẫu ngôn ngữ hoặc từ vựng nhất định. Ví dụ năm 2018, ta có hai loại phần mềm trợ lý giọng nói phổ biến:

  • Trợ lý ảo tại nhà
  • Trợ lý ảo tại công sở

Loại đầu tiên thuộc về tự động hóa ngôi nhà (còn gọi là nhà thông minh), một hệ thống cho phép điều khiển thiết bị, ánh sáng, điện, thiết bị và những thứ khác lấp đầy trong nhà của chúng ta. Nhà thông minh đòi hỏi phải có kết nối internet và là một phần của Internet vạn vật (IoT). Loại thứ hai, trợ lý ảo cho nơi làm việc, có thể được sử dụng ngoài liên lạc với tự động hóa tòa nhà, như một ứng dụng độc lập được kết hợp như thói quen của mọi người trong nhóm.

tất cả các tìm kiếm trên internet sẽ được thực hiện bằng giọng nói vào năm 2020
của các tổ chức triển khai chatbot AI trong công ty của họ
của các công ty áp dụng trợ lý giọng nói sử dụng chúng soạn văn bản thay thế việc gõ thủ công
của các tổ chức tận hưởng cách chatbot đơn giản hóa sự hợp tác giữa các nhóm
của các doanh nghiệp sử dụng trợ lý AI để quản lý lịch nhân viên

Ba gã khổng lồ đầu tiên trong sản xuất sản phẩm công nghệ trợ lý ảo hàng đầu bao gồm Siri được phát triển bởi Apple Inc., công ty độc quyền cung cấp các thiết bị của Apple, Google Assistant từ Google Inc. được phát triển cho HĐH AndroidAmazon Alexa, với một ứng dụng tương thích cho cả iOSAndroid. Tất nhiên, có rất nhiều ứng dụng trợ lý giọng nói nhỏ hơn nhưng vẫn được sử dụng trên thị trường. 

Ứng dụng trợ lý ảo: TOP 10

1. Trợ lý Google

Giá: Miễn phí

Nền tảng được hỗ trợ: Hệ điều hành-Android, iOS, Chrome OS, iOS, Linux

Thiết bị thông minh - Google Home

Có thể cho rằng ứng dụng trợ lý giọng nói tốt nhất cho các thiết bị Android, Google Assistant, hiện cũng hỗ trợ iPhone. Với rất nhiều tính năng, sử dụng Google Assistant, bạn có thể thực hiện nhiều công việc như thực hiện cuộc gọi bằng khẩu lệnh; nó tự động dự đoán nhu cầu của bạn, Google Now trên Tap và hơn thế nữa. Bạn thậm chí có thể kết nối nó với các thiết bị gia đình thông minh như đèn Philips Hue.

Trợ lý Google có thể:

  • Điều khiển thiết bị nhà thông minh
  • Tìm thông tin trực tuyến, chẳng hạn như chỉ dẫn, đặt nhà hàng, tin tức, vv
  • Phát nội dung trên Chromecast
  • Mở ứng dụng và thực hiện cuộc gọi
  • Điều khiển nhạc
  • Chạy bộ hẹn giờ và lời nhắc
  • Đặt lịch hẹn
  • Đọc thông báo
  • Đọc chuyển đổi thời gian thực

Google không chỉ sử dụng những kỹ sư giỏi nhất để biến ứng dụng thành một nhà vô địch không thể tranh cãi mà còn liên tục cập nhật nó với các bản cải thiện tính bảo mật và các tính năng mới. Nếu bạn là người dùng điện thoại Android, thì rất có thể Google Assistant đã được cài đặt sẵn, kích hoạt nó. Và nếu bạn vẫn chưa có kinh nghiệm, thì bạn nên thử.

2. Amazon Alexa

 

Giá: Miễn phí

Các nền tảng được hỗ trợ: Hệ điều hành-Android, iOS, Linux, Cortana

Thiết bị thông minh - Amazon Echo, Fire TV Stick.

Lần đầu tiên được phát hành với Amazon Echo, Alexa sớm trở thành một trợ lý giọng nói ảo được công nhận rộng rãi. Tuy nhiên, không giống như Google Assistant, có thể khó sử dụng Amazon Alexa trừ khi bạn đang dùng nó với thiết bị Echo hoặc Firestick. Là một ứng dụng trên điện thoại thông minh Android hoặc Apple của bạn, Alexa chủ yếu là bộ điều khiển cho các thiết bị thông minh khác của Amazon.

Amazon Alexa được thiết kế để trở thành một trợ lý cá nhân với một nút chạm của người sử dụng. Với Alexa, bạn có thể trò chuyện bằng các lệnh như:

  • Alexa, cho tôi biết tin tức
  • Alexa, thời tiết gì?
  • Alexa, nói cho tôi một trò đùa
  • Alexa, chơi bài hát
  • Alexa đặt hẹn giờ 10 phút

Mặc dù được thiết kế để trở nên mạnh mẽ, nhưng hạn chế thiết bị của Alexa lại là lỗ hổng lớn nhất làm nó không thể trở thành trợ lý giọng nói tốt nhất.

3. Siri

Giá: Miễn phí

Các thiết bị được hỗ trợ: iPhone, Apple iPad, iPod touch, Macintosh, Apple TV, Apple Watch, HomePod

Siri là trợ lý giọng nói đầu tiên khiến iPhone trở nên phổ biến hơn. Được ra mắt vào tháng 10 năm 2011, Apple Siri đã đi được một chặng đường dài. Được tạo để cho phép người dùng iPhone sống cuộc sống tiện nghi, Siri có thể:

  • Trả lời câu hỏi
  • Thực hiện cuộc gọi
  • Danh bạ FaceTime
  • Gửi văn bản
  • Cung cấp thông tin cập nhật về thể thao
  • Đặt báo thức và thời gian, v.v.

Không giống như Google AssistantAmazon Alexa, Siri bị hạn chế nghiêm ngặt đối với các thiết bị của Apple và không tương thích đa nền tảng.

4. Cortana

Giá: Miễn phí

Các nền tảng được hỗ trợ: Windows 10, Windows 10 Mobile, Windows Phone 8, Android, iOS, Amazon Alexa, Gọi loa thông minh, Surface headphone, Microsoft Band, Xbox One và Windows Mixed Reality

Chúng ta đồng ý với một số nhà phê bình rằng Microsoft cần phải làm việc nhiều hơn với Cortana, tuy nhiên, chúng ta vẫn đưa trợ lý ảo này vào danh sách của mình vì có quá nhiều tiềm năng trong Cortana bị bỏ lại. Là một đáp trả cho Siri, Microsoft liền mạch, tích hợp Cortana vào Windows 10 để hỗ trợ đa nền tảng. Ngoài khả năng kiểm soát nhiều chức năng của Hệ điều hành Windows, với Cortana, bạn cũng có thể:

  • Gọi điện
  • Gửi tin nhắn văn bản
  • Ghi chép
  • Gửi email
  • Theo dõi bưu kiện
  • Thêm sự kiện vào lịch
  • Tìm kiếm trên web và nhận câu trả lời từ Bing bằng lệnh thoại

Bạn có thể thấy Cortana chưa hoàn hảo, nhưng nó vẫn là một trong những trợ lý giọng nói tốt nhất xung quanh. Thêm vào đó, sự phát triển tích cực của Microsoft đảm bảo sự cải thiện của nó theo thời gian.

5. Bixby

 

Giá: Miễn phí

Nền tảng được hỗ trợ: Chỉ các thiết bị Samsung

Samsung sẽ không bị tụt hậu trong cuộc chiến trợ lý cá nhân ảo. Để tham gia cuộc thi, hãng đã giới thiệu Bixby, ứng dụng trợ lý cá nhân của Samsung. Chỉ có sẵn cho các thiết bị Samsung, Bixby khá tốt một cách đáng ngạc nhiên và đây là lý do nó được liệt kê là một trong những trợ lý thông minh tốt nhất trong danh sách của chúng ta.

Với Samsung Bixby, bạn có thể:

  • Thực hiện tìm kiếm trên web bằng lệnh thoại
  • Đặt báo thức
  • Quản lý công việc hàng ngày
  • Thậm chí nó có thể yêu cầu đề xuất bữa tối
  • Tự động cập nhật trạng thái chuyến bay
  • Dịch giọng nói

Bixby hỗ trợ nhiều ứng dụng cũng như công nghệ nhà thông minh. Được phát hành vào tháng 4 năm 2017, Bixby vẫn còn mới nhưng tốt hơn hầu hết các lựa chọn khác. Trong tương lai, chúng ta hy vọng Bixby sẽ linh hoạt hơn và hỗ trợ nhiều thiết bị hơn, đến lúc đó nếu bạn sở hữu một thiết bị Samsung, hãy thử trợ lý giọng nói thông minh này, bạn sẽ thích trải nghiệm này.

6. DataBot

       

Giá: $ 4,99

Nền tảng được hỗ trợ: Windows, iOS, Android, Windows Phone

Nằm ngoài cuộc chiến với các công ty công nghệ lớn, DataBot là một ứng dụng trợ lý ảo cá nhân nằm cao hơn mức trung bình với đối thủ còn lại. Một ứng dụng đa nền tảng, với DataBot, bạn có được những thứ trợ lý cá nhân cơ bản nhất cùng với tùy chỉnh và chatbot. Có nhiều mô-đun khác nhau có sẵn mà bạn có thể sử dụng để tùy chỉnh trợ lý giọng nói này.

Các mô-đun có sẵn là:

  • Mô-đun cơ bản: đối thoại lời nói, nhận dạng, đèn pin, bộ đếm, hẹn giờ, trò chuyện, v.v.
  • Mô-đun từ điển: nghĩa, từ đồng nghĩa, từ nguyên, vv
  • 8 Mô-đun chủ đề: để tạo bài thuyết trình, thực hiện tìm kiếm trên web và trả lời câu hỏi
  • Môđun sức khỏe: các công cụ theo dõi sức khỏe như Máy tính BMI
  • Mô-đun lời nói đùa, câu bí ẩn, quotes
  • Mô-đun thư ký: nhắc nhở, đồng hồ báo thức, danh sách mua sắm, tìm kiếm bằng giọng nói, v.v.
  • Mô-đun cung hoàng đạo và tin tức
  • Mô-đun rèn luyện não bộ: bài tập toán học
  • Mô-đun âm thanh và âm nhạc

Không so với Google Assistant, Alexa hay Cortana, DataBot là một nỗ lực khá tốt để cung cấp trợ lý thông minh tốt nhất mà không phải từ một thương hiệu công nghệ lớn.

7. Trợ lý ảo Lyra

 

Giá: Miễn phí

Nền tảng hỗ trợ: Android, iOS

Một ứng dụng trợ lý cá nhân dựa trên đám mây, Lyra là một trợ lý giọng nói đa nền tảng có thể được sử dụng trên Điện thoại thông minh, máy tính bảng và máy tính. Tập trung vào việc thực hiện các cuộc hội thoại thông minh, bạn có thể mong đợi trợ lý ảo Lyra tìm thấy:

  • Nhà hàng và quán bar tốt nhất
  • Nhận báo cáo thời tiết
  • Nhanh chóng tìm vị trí trên Google Map
  • Dịch 70 ngôn ngữ
  • Thông tin về phương tiện truyền thông xã hội
  • Cung cấp kiến ​​thức chung

Tận dụng các thiết kế quan trọng, trợ lý giọng nói thông minh này có vẻ tốt nhưng thiếu cung cấp các tính năng có thể cạnh tranh với các ông lớn công nghệ. Không có quảng cáo hoặc mua bán trong ứng dụng, Lyra là một ứng dụng miễn phí phù hợp nhất cho những người không muốn các tính năng bổ sung trong ứng dụng trợ lý cá nhân.

8. Hound

Giá: Miễn phí

Nền tảng hỗ trợ: Android và iOS

Một ứng dụng trợ lý cá nhân sắp ra mắt, Hound, là một sản phẩm của SoundHound. Được phát hành vài năm trước, Hound đang giữ tốc độ tăng trưởng ổn định. Với tất cả những công việc cơ bản mà hầu hết các trợ lý Trí tuệ nhân tạo thực hiện như gọi điện, duyệt web và cài đặt lời nhắc, Hound có một số tính năng nâng cao cũng như máy tính thế chấp, hỗ trợ Expedia tích hợp cho đặt phòng khách sạn, tìm kiếm địa phương do Yelp cung cấp, đặt chỗ trên Uber và ứng dụng SoundHound Now.

Hiện chỉ được dùng trên nước Mỹ, Hound thỉnh thoảng vẫn sinh lỗi.

9. Mycroft

 

Giá: Miễn phí

Nền tảng hỗ trợ: Linux, Picroft, Android, Windows, macOS

Trợ lý giọng nói nguồn mở duy nhất trong danh sách, Mycroft, thực sự là một hệ điều hành dựa trên Linux sử dụng giao diện ngôn ngữ tự nhiên. Hãy nghĩ về nó như hệ điều hành Windows mà không cần bàn phím. Tất cả các chức năng được kiểm soát bằng quá trình xử lý ngôn ngữ tự nhiên.

Mycroft AI phù hợp nhất cho các nhà phát triển muốn có trợ lý giọng nói cho các ứng dụng của họ nhưng bị hạn chế bởi các giới hạn của Google Assistant, Amazon Alexa, Apple SiriMicrosoft Cortana. Tất cả các trợ lý ảo này không phải là nguồn mở, có ràng buộc về quyền riêng tư và chỉ giới hạn ở một số phần cứng. Mycroft đang khắc phục tất cả những hạn chế này.

10. Robin

Giá: Miễn phí

Nền tảng hỗ trợ: iOS, Android

Một trong những đối thủ thách thức Siri đầu tiên, hiện tại Robin Robin đã xuất hiện từ khá lâu. Các nhà phát triển cẩn thận về những tính năng họ phát hành trong sản phẩm cuối cùng, đó là lý do tại sao sau bao lâu, Robin với tư cách là trợ lý ảo vẫn đang trong giai đoạn thử nghiệm. Được thiết kế để trở thành một trợ lý giọng nói tối giản, ứng dụng này cung cấp:

  • Voice In, Voice out: Nhận dạng giọng nói tự nhiên để vận hành điện thoại của bạn
  • Nhắn tin không dùng tay
  • Hướng dẫn đỗ xe
  • Cập nhật giao thông cá nhân
  • Tìm kiếm và điều hướng địa phương
  • Đài phát thanh xã hội cá nhân: liệt kê các cập nhật trên Facebook và Twitter của bạn

Mặc dù đòi hỏi một số công việc và cải tiến hơn, Robin vẫn là một trợ lý giọng nói chất lượng trong danh sách trợ lý giọng nói tốt nhất của chúng ta.

Đáng chú ý: Phần mềm To do list

Giá: Miễn phí / Tùy chọn

Nền tảng hỗ trợ: iOS và Android

Nếu bạn đã đọc tất cả các mô tả về mọi trợ lý giọng nói tốt nhất mà chúng ta đã liệt kê, bạn có thể dễ dàng nhận ra rằng chúng có một bộ chức năng chung. Đó là: cài đặt lời nhắc, lập lịch tác vụ, tạo mục lịch và thêm ghi chú. To do list đã có các tính năng này và bạn có thể tích hợp thêm ứng dụng thời tiết và Tìm kiếm Google. Bạn có thể thiếu đi các tính năng thông minh như gọi bằng giọng nói và tích hợp nhà thông minh, nhưng nếu bạn không tìm kiếm các tính năng này, thì các ứng dụng như TickTick, Gt Nhiệm và Todoist lại là những lựa chọn tối ưu cho bạn.

Cách hệ thống trợ lý ảo hoạt động

Các ứng dụng trợ lý giọng nói hoạt động dựa trên hệ thống Nhận dạng giọng nói tự động (ASR). Các hệ thống ASR ghi lại lời nói và sau đó chia nhỏ thành các âm vị, sau này được xử lý thành văn bản. Một âm vị (không phải từ của âm tiết) là một đơn vị đo lường cơ bản để nhận dạng giọng nói của con người. Nhận dạng âm vị mang lại kết quả tốt hơn quá trình giải mã từ, vì người cuối cùng có xu hướng phân tích từ dưới dạng một đơn vị độc lập bỏ qua các giới hạn ngữ cảnh.

Cho dù bạn có thể sử dụng loại phần mềm nhận dạng giọng nói nào, tất cả đều dựa trên ASR. Nếu bạn đã từng tự hỏi làm thế nào để tạo ra một phần mềm trợ lý ảo, điều quan trọng nhất cần làm là làm quen với cách ASR hoạt động. Tóm lại, quá trình bắt đầu với việc thiết bị thu thập âm thanh với micrô. Các dạng sóng giọng nói đã ghi được chuyển thẳng sang phân tích âm thanh, được thực hiện ở ba cấp độ khác nhau:

  • Mô hình âm thanh, đại diện cho những âm vị được phát âm và những từ mà các âm vị này hoàn thành là gì;
  • Mô hình phát âm, phân tích cách phát âm của âm vị, có bất kỳ trọng âm hoặc đặc thù nào khác của bộ máy phát âm để nắm bắt sự biến đổi ngữ âm của lời nói;
  • Mô hình hóa ngôn ngữ, nhằm mục đích tìm kiếm xác suất theo ngữ cảnh tùy thuộc vào âm vị nào được ghi lại.

Tất cả các dữ liệu được xử lý bởi AI mà không cần sự tương tác của con người. Chúng ta giảm tỷ lệ lỗi xuất hiện bằng cách sử dụng các thuật toán học máy. Dữ liệu dạng sóng giọng nói sau đó được truyền đến bộ giải mã, nơi cuối cùng nó chuyển thành văn bản để sử dụng thêm như lệnh hoặc chính tả.

Trí thông minh nhân tạo mang đến cho các ứng dụng trợ lý giọng nói hiện đại sự tự do không dựa vào vốn từ vựng hạn chế, mà sử dụng lưu trữ đám mây với hàng triệu từ và cụm từ thay thế. Nói cách khác, học máy làm cho các ứng dụng nghe toàn bộ bài phát biểu, không phải mỗi từ riêng biệt. Bằng cách đó, các ứng dụng giọng nói sẽ phân tích bối cảnhxác suất để xác định những gì bạn đang cố gắng nói. Ví dụ: Google sử dụng một mạng nơ-ron kỹ thuật số tương tự như các mạng trong các tế bào não người. Về cơ bản, mạng lưới thần kinh nhân tạo này mô phỏng hoạt động thần kinh của bộ não của chúng ta và bắt chước các quá trình bắt đầu khi chúng ta nghe thấy dòng âm thanh liên tục. Tuy khác nhau về cấu trúc, 3 các trợ lý ảo phổ biến nhất hiện nay là Google Assistant, CortanaSiri đều dựa trên nền tảng là công nghệ mạng nơ-ron sâu ở phần backend.

Ứng dụng thực tế của Trợ lý ảo

Phát triển mạng nơ-ronxử lý ngôn ngữ tự nhiên hoàn toàn hoạt động theo hướng biến điều khiển giọng nói thành một tiêu chuẩn mới cho nhiều sản phẩmhành động mà mọi người sử dụng/thực hiện hàng ngày. Chiến lược Amazon Alexa Everywhere bắt đầu một xu hướng mới của các công ty phát hành bộ công cụ phát triển thiết bị dịch vụ để tích hợp ứng dụng trợ lý giọng nói. Các nhà sản xuất thiết bị gia dụng như LGWhirlpoolPhillips đã bắt đầu phát hành các mặt hàng hỗ trợ Alexa và phản ứng của người tiêu dùng nhanh chóng thu hút sự chú ý của các doanh nhân vào các ứng dụng trợ lý giọng nói. 72% chủ sở hữu trợ lý ảo thừa nhận rằng thiết bị của họ nhanh chóng trở thành một phần thiết yếu trong thói quen hàng ngày của họ và họ không muốn bỏ bộ điều khiển giọng nói này do thói quen bắt đầu hình thànhdễ sử dụng

Vì vậy, các nghĩa vụnhiệm vụ thực tế mà ứng dụng trợ lý AI có thể làm cho con người là gì? Bao nhiêu trong số chúng hoạt động tốt? Sau đây là một vài công việc mà trợ lý ảo có thể thực hiện cho bạn:

  • Gửi thông tin cập nhật về các chủ đề mà bạn quan tâm mà không cần bạn tìm kiếm chúng (ví dụ: luật & quy định mới được chính phủ triển khai nếu áp dụng cho doanh nghiệp của bạn);
  • Báo cáo thời tiết;
  • Thêm các sự kiện và các cuộc họp vào lịch của một nhóm hoặc từng thành viên riêng biệt;
  • Đặt báo thức và nhắc nhở để mọi thứ diễn ra theo đúng lịch trình;
  • Trả lời câu hỏi chung bằng giọng nói (thay vì mở liên kết để bạn tìm kiếm câu trả lời);
  • Tạo và điền vào danh sách việc cần làm;
  • Thực hiện dịch thuật thời gian thực;
  • Ngay lập tức cập nhật cho bạn về lưu lượng trên tuyến đường của bạn (đặc biệt hữu ích cho các hoạt động hậu cần);
  • Theo dõi hàng tồn kho trong kho và tự động điền vào danh sách mua sắm với các mặt hàng sẽ được đưa ra ngoài;
  • Điều khiển các thiết bị khác từ ánh sáng đến PC;
  • Đọc email và các tài liệu khác thành tiếng thay vì bạn đọc chúng;
  • Ghi lại lời nói chính tả và chuyển nó thành văn bản thay vì bạn gõ thủ công;   
  • Tìm các doanh nghiệp địa phương và nhà thầu cho nhu cầu hiện tại của bạn.

Tóm lại

Những ông lớn đã bắt đầu khám phá ra những lợi ích của việc điều khiển bằng giọng nói để tạo ra một xu thế phát triển mới cho các doanh nghiệp vừa và nhỏ. Việc tự tạo ra một trợ lý ảo cho riêng mình sẽ không còn quá xa vời. Trong phần sau mình sẽ viết một bài hướng dẫn để tạo ra trợ lý ảo hỗ trợ bằng tiếng Việt. Mọi người cùng theo dõi nha