การกำหนดแบบจำลองทางสถิติการถดถอย

การวิเคราะห์ถดถอยวิเคราะห์ความสัมพันธ์ระหว่างตัวแปร

การถดถอยเป็นเทคนิคการทำเหมืองข้อมูลที่ใช้ในการคาดการณ์ช่วงของค่าตัวเลข (เรียกอีก อย่าง ว่า ค่าต่อเนื่อง ) โดยให้ข้อมูลที่เฉพาะเจาะจง ตัวอย่างเช่นการถดถอยอาจถูกใช้เพื่อทำนายต้นทุนของผลิตภัณฑ์หรือบริการโดยให้ตัวแปรอื่น ๆ

การถดถอยถูกใช้ในหลายอุตสาหกรรมสำหรับการวางแผนธุรกิจและการตลาดการพยากรณ์ทางการเงินการสร้างแบบจำลองด้านสิ่งแวดล้อมและการวิเคราะห์แนวโน้ม

การถดถอย Vs. การจัดหมวดหมู่

การถดถอยและการ จำแนก เป็นเทคนิคการทำเหมืองข้อมูลที่ใช้ในการแก้ปัญหาที่คล้ายคลึงกัน แต่มักสับสน ทั้งสองใช้ในการวิเคราะห์คำทำนาย แต่การถดถอยถูกนำมาใช้เพื่อทำนายค่าตัวเลขหรือค่าต่อเนื่องในขณะที่การจัดหมวดหมู่กำหนดข้อมูลให้เป็นหมวดหมู่ที่ไม่ต่อเนื่อง

ตัวอย่างเช่นการถดถอยจะใช้เพื่อคาดการณ์มูลค่าบ้านตามที่ตั้งตารางฟุตราคาขายล่าสุดราคาของบ้านที่คล้ายกันและปัจจัยอื่น ๆ การจำแนกประเภทจะเป็นไปตามลำดับถ้าคุณต้องการจัดบ้านให้เป็นหมวดหมู่เช่นการเดินเล่นขนาดของล็อตหรืออัตราอาชญากรรม

ประเภทของเทคนิคการถดถอย

แบบถดถอยที่ง่ายที่สุดและเก่าแก่ที่สุดคือการถดถอยเชิงเส้นที่ใช้ในการประมาณความสัมพันธ์ระหว่างสองตัวแปร เทคนิคนี้ใช้สูตรทางคณิตศาสตร์ของเส้นตรง (y = mx + b) ในแง่ธรรมดานี่ก็หมายความว่าให้กราฟกับ Y และแกน X ความสัมพันธ์ระหว่าง X และ Y เป็นเส้นตรงที่มีค่าผิดปกติเพียงเล็กน้อย ตัวอย่างเช่นเราอาจสันนิษฐานได้ว่าการเพิ่มขึ้นของประชากรการผลิตอาหารจะเพิ่มขึ้นในอัตราเดียวกัน - ต้องใช้ความสัมพันธ์เชิงเส้นที่แข็งแกร่งระหว่างสองร่าง เพื่อให้เห็นภาพนี้ให้พิจารณากราฟที่แกน Y จะติดตามการเพิ่มจำนวนประชากรและแกน X จะติดตามการผลิตอาหาร เมื่อค่า Y เพิ่มขึ้นค่า X จะเพิ่มขึ้นในอัตราเดียวกันทำให้ความสัมพันธ์ระหว่างเส้นตรงเป็นเส้นตรง

เทคนิคขั้นสูงเช่นการถดถอยพหุคูณทำนายความสัมพันธ์ระหว่างตัวแปรหลายตัวแปรตัวอย่างเช่นความสัมพันธ์ระหว่างรายได้การศึกษาและสถานที่ที่เราเลือกอาศัยอยู่หรือไม่? การเพิ่มตัวแปรอื่น ๆ จะเพิ่มความซับซ้อนในการทำนาย มีหลายรูปแบบของเทคนิคการถดถอยหลาย ได้แก่ มาตรฐานลำดับชั้น setwise และ stepwise แต่ละที่มีการประยุกต์ใช้ของตัวเอง

ณ จุดนี้สิ่งสำคัญคือต้องทำความเข้าใจกับสิ่งที่เรากำลังพยายามทำนาย (ตัวแปรที่ขึ้นต้นหรือที่ คาดการณ์ไว้ ) และข้อมูลที่เราใช้ในการทำนาย (ตัวแปรอิสระหรือ predictor ) ในตัวอย่างของเราเราต้องการทำนายตำแหน่งที่หนึ่งเลือกที่จะมีชีวิตอยู่ (ตัวแปร คาดการณ์ ) ที่ให้รายได้และการศึกษา (ทั้งตัวแปร ทำนาย )