Deep AI – Giải pháp thông minh cho bài toán giá nhà ở

Rate this post

Image

Xây dựng mô hình dự đoán giá nhà là một vấn đề quan trọng trong lĩnh vực bất động sản. Để giải quyết vấn đề này, chúng ta có thể sử dụng các mô hình học máy như cây quyết định.

Bộ dữ liệu và ý nghĩa của trường dữ liệu

Bộ dữ liệu được sử dụng trong bài toán này là bộ dữ liệu về giá nhà ở Boston, bao gồm 13 quan sát và 506 biến. Các trường dữ liệu có ý nghĩa như sau:

  • crim: Tỷ lệ phạm tội phạm bình quân đầu người theo thị trấn.
  • zn: Tỷ lệ đất ở được quy hoạch cho các lô trên 25.000 foot square.
  • indus: Tỷ lệ diện tích thuộc lĩnh vực kinh doanh phi bán lẻ trên mỗi thị trấn.
  • chas: Biến giả, = 1 nếu được bao bởi sông Charles River, = 0 nếu ngược lại.
  • nox: Nồng độ khí Ni-tơ oxit.
  • rm: Trung bình số phòng trên một căn hộ.
  • age: Tỷ lệ căn hộ được xây dựng trước năm 1940.
  • dis: Khoảng cách trung bình có trọng số tới 5 trung tâm việc làm lớn nhất ở Boston.
  • rad: Chỉ số về khả năng tiếp cận đường cao tốc.
  • tax: Giá trị thuế suất tính trên đơn vị 10000$.
  • ptratio: Tỷ lệ học sinh-giáo viên trên mỗi thị trấn.
  • black: Tỷ lệ số người da đen trong thị trấn được tính theo công thức: 1000(Bk−0.63)2 ở đây Bk là tỷ lệ người da đen trong thị trấn.
  • lstat: Tỷ lệ phần trăm dân số thu nhập thấp.

Trong bài toán này, chúng ta phân loại giá nhà ở thành nhãn 1 (giá cao) và nhãn 0 (giá thấp) dựa trên giá nhà có giá trị lớn hơn 20 nghìn USD hoặc nhỏ hơn.

Xây dựng mô hình cây quyết định

Để dự đoán giá nhà, chúng ta sử dụng mô hình cây quyết định với độ sâu tối đa là 3. Độ sâu ở đây chính là số lượng tối đa các câu hỏi từ node gốc tới node lá. Điều này giúp chúng ta hiểu rõ quá trình ra quyết định của mô hình.

Sử dụng hàm export_graphviz() để biểu đồ hóa cây quyết định. Trong hàm này, chúng ta chỉ cần truyền vào mô hình, tên các đặc trưng đầu vào thông qua đối số feature_names và các nhãn thông qua đối số class_names.

Cách dự báo từ cây quyết định

Từ cây quyết định, chúng ta có thể dự báo nhãn cho các quan sát. Ví dụ, khi có các giá trị đầu vào là LSTAT = 10, RM = 6, DIS = 3, chúng ta có thể tuần tự đặt và trả lời các câu hỏi:

  • LSTAT <= 14.115 là đúng, rẽ sang nhánh True bên trái.
  • Tiếp theo, RM <= 6.034, kết quả trả về là True. Rẽ sang nhánh bên trái.
  • Tiếp theo, DIS <= 4.714, kết quả trả về là True. Rẽ sang bên trái và thu được kết quả dự báo là nhãn high.

Minh chứng cho nhận định trên, chúng ta có thể thử nghiệm dự báo cho 5 quan sát với LSTAT = 10, RM = 6, DIS = 3 cố định và thay đổi các giá trị khác để kiểm tra kết quả dự báo. Kết quả cho thấy, miễn là 3 giá trị LSTAT = 10, RM = 6, DIS = 3 thoả mãn, chúng ta đều thu được dự báo có nhãn là 1. Điều này chứng tỏ dự báo từ cây quyết định đã tuân theo qui luật rẽ nhánh.

Muốn tìm hiểu thêm về giải pháp thông minh cho bài toán giá nhà ở, hãy ghé thăm Luật Sư Tuấn ngay hôm nay!

Related Posts

HỢP ĐỒNG NHẬP KHẨU

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAMCó thể bạn quan tâm Mẫu Biên bản phạt vi phạm hợp đồng chuẩn và cách lập chi tiết Quyết…

Hợp Đồng Dịch Vụ Tư Vấn

Cung cấp thông tin cần thiết trước khi tiến hành Hôm nay, ngày …. tháng … năm ….., tại địa chỉ …………………Có thể bạn quan tâm Mẫu…

Mẫu quyết định tăng lương cho người lao động mới nhất [2023]

Có thể bạn quan tâm Thủ tục nhập học đại học, cao đẳng năm 2023-2024 HỢP ĐỒNG CHUYỂN NHƯỢNG QUYỀN SỬ DỤNG ĐẤT VÀ TÀI SẢN GẮN…

Mẫu quyết định chỉ định thầu rút gọn

Việc ra quyết định chỉ định thầu rút gọn có căn cứ từ Văn bản hợp nhất 12/VBHN-VPQH 2019 Luật Đấu Thầu. Điều 37 của văn bản…

Mẫu quyết định bổ nhiệm chủ tịch HĐQT

Bạn đang tìm kiếm thông tin về mẫu quyết định bổ nhiệm Chủ Tịch HĐQT? Trong bài viết này, chúng tôi sẽ giới thiệu về cách sử…

Tổng hợp mẫu hợp đồng thuê nhân sự ngoài mới nhất hiện nay

Hợp đồng thuê nhân sự ngoài là một loại hợp đồng mà một bên (thường là doanh nghiệp hoặc tổ chức) thuê một đối tác bên ngoài…