Skip to content

Latest commit

 

History

History
74 lines (48 loc) · 9.12 KB

intro.md

File metadata and controls

74 lines (48 loc) · 9.12 KB
jupytext kernelspec
text_representation
extension format_name format_version jupytext_version
.md
myst
0.12
1.8.2
display_name language name
Python 3
python
python3

Lời nói đầu

AI là một ngành khoa học đang rất phát triển trên thế giới. Chúng ta không thể phủ nhận vai trò của những mô hình và thuật toán đang ngày càng quan trọng đối với con người. Nó len lỏi vào cuộc sống hàng ngày của bạn, thay đổi thói quen của bạn mà bạn có thể không nhận ra. Khi bạn lướt facebook, những tin tức mà bạn đọc được đều là kết quả đã được khuyến nghị từ thuật toán. Bạn lướt một trang web và nhận được các banner quảng cáo đúng sản phẩm mình cần. Bạn vào một bệnh viện khám bệnh, kết quả của bạn nhận được có thể một phần được đóng góp từ dự đoán của thuật toán. Điện thoại của bạn có thể phân biệt được bạn và em trai của bạn. Tất cả những điều này giúp cuộc sống của chúng ta trở nên tiện tích hơn rất nhiều.

Ngày nay vai trò của AI ngày một lớn hơn đối với con người. Chính vì thế nó nhận được sự đầu tư mạnh mẽ từ khắp các công ty công nghệ trên toàn cầu và thậm chí AI nằm trong chiến lược phát triển và cạnh tranh về công nghệ giữa các quốc gia. Do nhận được sự đầu tư mạnh mẽ như vậy nên các công việc liên quan tới AI cũng được coi là mang lại một mức thu nhập cao hơn so với những ngành khác. AI đồng thời cũng thu hút được một lượng người học đông đảo không chỉ tại Việt Nam mà còn trên thế giới.

Cộng đồng AI Việt Nam

Tại Việt Nam công đồng AI còn khá non trẻ, mặc dù trên thế giới thì nhiều nhà khoa học của Việt Nam đã thành công trong lĩnh vực này từ trước đó. Cộng đồng AI Việt Nam trong nước bắt đầu hình thành từ năm 2016 và nó gắn liền với làn sóng của cách mạng công nghiệp 4.0 trên thế giới. Trong giai đoạn này tại Việt Nam, thông qua truyền thông và báo chí đã nhấn mạnh vai trò của cách mạng công nghiệp 4.0 đối với sự phát triển của quốc gia. AI được xem là công cụ để thay đổi cơ cấu lao động và nguồn nhân lực trong tương lai và là chìa khoá để Việt Nam tận dụng vươn lên trong chuỗi cạnh tranh toàn cầu. Chính vì thế ý thức của người Việt được nâng cao hơn về AI. Từ thay đổi nhận thức đã dẫn tới hành động. AI trở thành một ngành khoa học rất hot vào thời điểm này. Phong trào học AI thu hút được sự quan tâm của đông đảo các bạn sinh viên và vào thời điểm đó, những cộng đồng về AI bắt đầu được hình thành. Nổi bật nhất đó là forum machine learning cơ bản của tác giả Tiệp Vũ. Sau đó tác giả cũng cho xuất bản cuốn machine learning cơ bản là cuốn sách gối đầu của nhiều người học AI Việt Nam. Kể từ sau sự thành công của machine learning cơ bản thì xuất hiện ngày càng nhiều hơn những blog về AI của các tác giả khác như:

Tài liệu về AI khi đó tại Việt Nam khá thiếu thốn về số lượng và chất lượng. Nhờ sự đóng góp nhóm anh Tiệp Vũ mà cộng đồng AI Việt đã có thêm nhiều bản ebook chất lượng như:

Tuy nhiên phong trào học tập AI trong nước tại Việt Nam còn khá đại trà và theo hướng ứng dụng. Do đó về lâu dài Việt Nam không thể tạo ra lợi thế so sánh với thế giới bởi thiếu đi những nhà khoa học chất lượng cao để phát triển AI.

Từ năm 2018 bắt đầu hình thành những viện nghiên cứu lớn về AI tại Việt Nam, được tập đoàn Vingroup đầu tư mạnh mẽ về cơ sở hạ tầng nhằm giải quyết những bài toán lớn của người Việt. Những viện nghiên cứu này đã qui tụ được nhóm các nhà khoa học tâm huyết, muốn quay trở về đóng góp và thúc đẩy nền khoa học nước nhà như viện nghiên cứu VinAI, Vinbigdata, VinBrain. Bên cạnh đó các tập đoàn khác cũng thúc đẩy ứng dụng và nghiên cứu AI như FPT, Viettel, Zalo.

VinAI là viện nghiên cứu đầu tiên đưa Việt Nam lên bản đồ AI thế giới với những công trình lần đầu tiên được công bố tại những hội nghị học máy hàng đầu như NEURIPS, ICML, CVPR,.... Từ đó có sự giao lưu giữa khoa học Việt Nam và thế giới, những nhà nghiên cứu trên thế giới đã biết đến nhiều hơn về các công trình nghiên cứu AI từ các nhà khoa học của Việt Nam.

Nhờ những chiến lược tận dụng được sức mạnh trí tuệ của người Việt đã hứa hẹn mang lại một tương lai tốt đẹp hơn cho nền khoa học và công nghệ Việt Nam.

Về cuốn sách này

Đây là một dự án nhằm ủng hộ cộng đồng AI Việt Nam được tác giả viết dựa trên việc tổng hợp những bài viết từ blog của mình. Cuốn sách này có tựa đề là "Machine Learning lý thuyết tới thực hành". Lý do tác giả lựa chọn tiêu đề như vậy là vì nó thể hiện đúng mục tiêu của cuốn sách đó là cân bằng giữa lý thuyết và thực hành.

  • Trong cuốn sách này sẽ trình bày các thuật toán từ cơ bản tới nâng cao kèm theo code thực hành và bài tập.
  • Các kiến thức về toán đại số tuyến tính, giải tích ma trận và xác suất sẽ được chú trọng.
  • Các kỹ thuật visualization và xử lý dữ liệu trên python cho người mới bắt đầu.
  • Các ứng dụng của machine learning trong các bài toán phổ biến như phân loại nợ xấu, phân loại bệnh, dự báo chuỗi thời gian, phân khúc khách hàng.
  • Các thuật toán image classification, object detection, face id trong computer vision.
  • Các bài toán seq2seq, sentiment analysis, NER, POS và các lớp mô hình LSTM, GRU, BERT trong NLP.
  • Các module như pandas, numpy, sklearn, matplotlib sẽ được hướng dẫn theo hướng thực hành qua case study liên quan tới Machine Learning.
  • Bạn sẽ nắm vững cách training và deploy model deep learning trên pytorch, tensorflow.

Cuốn sách hướng tới các bạn chưa biết gì về AI có thể hiểu cách thuật toán hoạt động và tự huấn luyện được mô hình AI ở mỗi chương.

Đóng góp vào dự án

Vì là một dự án phi lợi nhuận nên tác giả để mã nguồn của cuốn sách tại deepaibook. Bạn đọc có thể gửi ý kiến đóng góp về nội dung của cuốn sách thông qua mục issues. Khi cần cập nhật hoặc bổ sung thêm về tính đúng đắn của nội dung cuốn sách, tác giả khuyến nghị bạn đọc tạo một pull request.

Bạn đọc muốn đóng góp nội dung cho cuốn sách có thể thảo luận trực tiếp với tác giả bằng cách inbox tới Phạm Đình Khánh.

Bố cục cuốn sách

Trong cuốn sách mình sẽ trình bày các nội dung chính như sau:

  1. Kiến thức cơ bản về python: Nhằm hướng dẫn cho các bạn mới bắt đầu làm quen với ngôn ngữ lập trình python. Bạn đọc sẽ nắm vững cấu trúc dữ liệu và câu lệnh điều kiện và vòng lặp trên python. Làm quen với cài đặt môi trường, sử dụng IDE và đặc biệt là sử dụng google colab và kaggle.

  2. Toán và xác suất: Ôn tập lại các kiến thức về đại số tuyến tính, giải tích ma trận và xác suất để hỗ trợ bạn hiểu lý thuyết về thuật toán tốt hơn.

  3. Mô hình Machine learning: Các mô hình dự báo và mô hình phân loại với các case studies ứng dụng thực tiễn.

  4. Mô hình Deep learning: Các mô hình trong Computer Vision và NLP