Tin FSI

Trang chủ > Tin tức và sự kiện > Tin FSI > Dịch vụ BPO – Các loại gán nhãn dữ liệu thường gặp

Dịch vụ BPO – Các loại gán nhãn dữ liệu thường gặp

20 Tháng Chín 2021

Có nhiều loại Gán nhãn (GN) dữ liệu khác nhau. Mỗi loại sẽ phù hợp với mỗi trường hợp sử dụng khác nhau. Dưới đây là  một số kiểu gán nhãn phổ biến được sử dụng cho các dự án máy học.

GÁN NHÃN NGỮ NGHĨA

GN ngữ nghĩa là nhiệm vụ chú thích các khái niệm khác nhau trong văn bản. Ví dụ cho việc GN ngữ nghĩa là gán nhãn người, đồ vật hoặc tên công ty. Mô hình học máy sử dụng dữ liệu được chú thích về mặt ngữ nghĩa để tìm hiểu cách phân loại các khái niệm mới trong văn bản mới. Điều này có thể giúp cải thiện mức độ liên quan của tìm kiếm và đào tạo các chatbot.

Tham Khảo:

Dịch vụ BPO - Các loại gán nhãn dữ liệu thường gặp

Dịch vụ BPO – Các loại gán nhãn dữ liệu thường gặp

GÁN NHÃN HÌNH ẢNH VÀ VIDEO

GN hình ảnh có nhiều dạng khác nhau, từ việc đóng khung lên hình ảnh, đến phân đoạn ngữ nghĩa. Trong GN hình ảnh, mỗi pixel trong hình ảnh được gán một ý nghĩa. Nhãn này thường giúp mô hình học máy nhận ra khu vực được chú thích là đối tượng riêng biệt. Loại dữ liệu này thường cơ sở cho các mô hình nhận dạng hình ảnh. Nó có thể nhận dạng và chặn nội dung nhạy cảm. Và hướng dẫn các phương tiện tự hành hoặc thực hiện các tác vụ nhận dạng khuôn mặt.

Tương tự như GN hình ảnh, GN video thường liên quan đến việc thêm các khung hoặc các điểm chính vào nội dung. Điều này có thể được thực hiện trên cơ sở từng khung hình. Sau đó, các khung hình này được ghép lại với nhau để giúp theo dõi chuyển động của đối tượng được gán nhãn trong chính video bằng cách sử dụng công cụ chú thích video. Loại dữ liệu này đóng vai trò quan trọng trong việc phát triển các mô hình thị giác máy tính. Nó hỗ trợ cho các nhiệm vụ như theo dõi và bản địa hóa đối tượng.

PHÂN LOẠI VĂN BẢN

Phân loại văn bản và phân loại nội dung đề cập đến nhiệm vụ đánh giá các danh mục đã được xác định trước cho tài liệu. Ví dụ: bạn có thể gắn thẻ các câu hoặc đoạn văn trong tài liệu theo chủ đề hoặc sắp xếp các bài báo theo chủ đề như trong nước, quốc tế, thể thao hoặc giải trí.

Dịch vụ BPO - Các loại gán nhãn dữ liệu thường gặp

Dịch vụ BPO – Các loại gán nhãn dữ liệu thường gặp

GÃN NHÃN THỰC THỂ

Gán nhãn thực thể là quá trình gán nhãn các câu không có cấu trúc với thông tin để máy có thể đọc chúng.

Trong chú thích thực thể, có vô số quy trình có thể được phân lớp để tạo ra sự hiểu biết về ngôn ngữ. Ví dụ:

  • Nhận dạng thực thể có tên (NER): công việc này đề cập đến việc phân loại các đối tượng được đặt tên có trong nội dung văn bản. Các thực thể này được gắn nhãn dựa trên các danh mục được xác định trước như người, tổ chức và địa điểm. Các mô hình nhận dạng thực thể có tên bổ sung kiến thức ngữ nghĩa vào nội dung của bạn, giúp các cá nhân và hệ thống dễ dàng xác định và hiểu chủ đề của bất kỳ văn bản nhất định nào một cách nhanh chóng.
  • Liên kết thực thể: Đây là quá trình chú thích mối quan hệ giữa hai phần của văn bản.

Ngoài những loại gán nhãn dữ liệu trên, còn có rất nhiều loại gán nhãn dữ liệu khác. Trong bài viết này, FSI-BPO chỉ cung cấp thông tin về những loại gán nhãn trên để bạn có thêm tham khảo thêm.

NHỮNG DỊCH VỤ FSI-BPO CUNG CẤP: