Azure AI Tutorial 3 - Azure Computer Vision Là Gì?
Computer Vision là một những mảng chính của Machine Learning nói riêng và AI nói chung . Computer Vision tập trung vào “thị giác” và hiểu được ngữ cảnh. Hầu hết các giải pháp của Computer Vision dựa vào cameras, videos, images…
Một số task chính của computer vision
- Image classification: Nhận biết và phân loại đối tượng dựa trên ngữ cảnh. Ví dụ phân loại xe như xe máy, xe ô tô , xe bus.
- Object detection: Khác với image classification, object detection nhận biết đối tượng dựa trên location với bounding box.
- Sematic segmentation: Phân loại đối tượng nâng cao dựa trên từng pixels của đối tượng.
- Image analysis: Có thể trích xuất các thông tin trên hình ảnh, mô tả captions để hiểu ngữ nghĩa của ảnh.
- Face detection, analysis and recognition: Nhận diện khuân mặt người, Có thể kết hợp các model để nhận diện cảm xúc, độ tuổi, giới tính…
- Nhận diện chữ viết tay (Optical character recognize): Chúng ta có thể đọc text trên tấm ảnh hoặc video. Trích xuất thông tin từ hóa đơn, form, hay tài liệu.
Các bạn có thể xem demo tại đây: https://aidemos.microsoft.com/computer-vision
và đây nữa https://azure.microsoft.com/en-us/services/cognitive-services/computer-vision/
Cùng thực hành Azure Computer Vision
Phần này sẽ có nhiều demo nên mình sẽ chia thành các demo nhỏ:
3.1 Bài toán Classification trên Azure Custom Vision.
3.2 Bài toán Object Detection trên Azure Custom Vision
3.3 Bài toán liên quan tới khuân mặt: Face Analysis , Find similar faces, Face Recognization.
3.4 Bài toán OCR, Form Recognizer
Hẹn gặp lại các bạn trong phần tiếp theo nhé.