ML.NET 2.0 nâng cao phân loại văn bản

Microsoft đã ra mắt ML.NET 2.0, phiên bản mới nhất đã cập nhật một số yếu tố của mã nguồn mở, khung máy học đa nền tảng (cross-platform machine learning framework). Dành cho các nhà phát triển .NET, có khả năng phân loại văn bản và cho phép tích hợp các mô hình máy học tùy chỉnh vào các ứng dụng .NET.

ML.NET phiên bản 2.0 phát hành song song với phiên bản mới của trình tạo Model Builder hiện đã được phát hành!

Model Builder giới thiệu một kịch bản phân loại văn bản được cung cấp bởi ML.NET- Text Classification API (API phân loại văn bản). Đúng như tên gọi, API Text Classification cho phép các nhà phát triển train các mô hình tùy chỉnh để phân loại dữ liệu văn bản thô, bằng cách tích hợp triển khai TorchSharp của NAS-BERT vào ML.NET. Kịch bản Model Builder hỗ trợ training cục bộ trên CPUs hoặc GPUs tương thích với CUDA.

Những phát triển khác cũng trong ML.NET 2.0

  • Train các mô hình phân loại nhị phân (binary classification), phân loại đa lớp (multiclass classification) và hồi quy được cấu hình sẵn giúp bắt đầu sử dụng máy học dễ dàng hơn.
  • Quá trình tiền xử lý dữ liệu được tự động hóa bằng AutoML Featurizer.
  • Nhà phát triển có thể chọn giảng viên nào được sử dụng như một phần của quy trình training.
  • Các tùy chọn đào tạo AutoML nâng cao được giới thiệu để chọn người đào tạo và chọn số liệu đánh giá để tối ưu hóa.

Các nhà phát triển đằng sau ML.NET cũng dự định cải thiện API AutoML để đơn giản hóa quy trình học máy. Xem thêm chi tiết tại Microsoft.

Leave a Reply

Your email address will not be published. Required fields are marked *