วันจันทร์ที่ 14 ตุลาคม พ.ศ. 2562

Naked Statistics

Charles Wheelan


“สถิติไม่ใช่เรื่องของการคำนวณเลขหรือทำให้มิตรสหายและเพื่อนร่วมงานงงงวยไปกับเทคนิคสถิติขั้นสูง แต่สถิติคือการเรียนรู้สิ่งที่ส่งผลต่อชีวิตของเรา”

ชาร์ลส์ วีแลน อาจารย์เศรษฐศาสตร์และนโยบายสาธารณะที่วิทยาลัยดาร์ตมัธ จะเปิดเปลือยสถิติ เปลี่ยนเรื่องเข้าใจยากให้เข้าใจง่าย และพาเราไปยังแก่นความคิดของวิชานี้ ผ่านตัวอย่างที่เกี่ยวเนื่องกับชีวิตประจำวัน อาทิ สถิติจะช่วยแนะปัจจัยสาเหตุของโรคภัย ตามหานักกีฬาที่ดีที่สุดตลอดกาล สืบเสาะเบาะแสอาชญากร ตรวจจับกลโกงการลอกข้อสอบ บอกเหตุผลว่าทำไมไม่ควรซื้อลอตเตอรี่ ไปจนถึงตอบคำถามว่าโพลล์การเมืองได้ตัวเลขมาอย่างไร และประเมินสุขภาวะทางเศรษฐกิจของชนชั้นกลางในระยะยาว สถิติฉบับเซ็กซี่ เล่มนี้จะเปลี่ยนมุมมองที่เรามีต่อสถิติ ให้เห็นว่าแท้จริงแล้วสถิตินั้นสนุกเพียงใด และเชื่อมโยงกับชีวิตจริงอย่างไร แล้วคุณจะพบว่า สถิตินั้น “เซ็กซี่” แค่ไหน

คุณเป็นแฟนของระบบการจัดอันดับต่างๆ รึเปล่า ตามข้อมูลประสิทธิภาพรับประกันว่าจะพาคุณไปหาศัลยแพทย์ที่ดีที่สุดในเมืองหรือไม่? ถ้าเป็นเช่นนั้นคุณจะขึ้นอยู่กับสถิติเชิงพรรณนา และมิสเตอร์วีแลนมีคำแนะนำสำหรับคุณ: ระวัง วิธีที่ง่ายที่สุดสำหรับแพทย์ในเกมตัวเลขเหล่านี้คือการหลีกเลี่ยงผู้ป่วยที่ป่วยแล้วรักษาไม่ได้

เพื่อหาข้อมูลเกี่ยวกับการอยู่รอดโดยเฉลี่ยหรือไม่? คุณจะได้รับคำแนะนำที่ดีให้คิดออกว่าการอยู่รอดเฉลี่ยหรือค่ามัธยฐานที่คุณกำลังดูอยู่

คุณประทับใจกับการศึกษาที่แสดงให้เห็นว่าคนที่ทานวิตามิน X หรือออกกำลังกายแบบ Y อยู่ได้นานขึ้น? จำไว้ว่าความสัมพันธ์ไม่ได้บ่งบอกถึงสาเหตุ คุณหมกมุ่นกับการศึกษาที่อ้างว่าแสดงให้เห็นว่ารูปแบบการบริโภคอาหารที่หลากหลายก่อให้เกิดมะเร็งหรือไม่? อันที่จริงแล้วนายวีลลันชี้ให้เห็นว่างานวิจัยประเภทนี้ตรวจสอบได้ไม่มากว่าอาหารมีผลต่อความน่าจะเป็นของมะเร็งอย่างไรในการที่มะเร็งได้รับผลกระทบต่อความทรงจำของผู้คนเกี่ยวกับสิ่งที่พวกเขาเคยกิน


และในขณะที่เรากำลังพูดถึงอคติอย่าลืมอคติการตีพิมพ์: การศึกษาที่แสดงผลงานของยาได้รับการเผยแพร่ แต่สิ่งที่แสดงยานั้นไม่มีอะไรจะหายไป

คุณผ่านการกระจายค่าเฉลี่ยและข้อผิดพลาดมาตรฐานและก่อนที่คุณจะรู้ว่าคุณกระโจนเข้าสู่การวิเคราะห์การถดถอยซึ่งเป็นเครื่องมือสำหรับแยกสาเหตุและผลกระทบที่แตกต่างกันมากมาย คุณจะเข้าใกล้อย่างไม่ต้องสงสัยเพื่อทำความเข้าใจเทคนิคที่ทรงพลังที่เขาเรียกว่า "ไฮโดรเจน ระเบิดของสถิติ”

การวิเคราะห์การถดถอยเป็นเครื่องมือที่ขับเคลื่อนการศึกษาแบบสุ่มขนาดยักษ์ที่แจ้งการตัดสินใจทางการแพทย์ทุกครั้งที่มีคนให้คุณ มันอาจเป็นแรงผลักดันให้ดีหรือป่วยและแสดงให้เห็นว่ามันสามารถประสบความสำเร็จได้อย่างไรและจะล้มเหลวได้อย่างไร (หมายเหตุตัวอย่างเช่น flip-flop ขนาดยักษ์ที่เพิ่งได้รับจากเอสโตรเจน)

“ หนังสือเล่มนี้จะไม่ทำให้คุณเป็นผู้เชี่ยวชาญด้านสถิติ (…) หนังสือเล่มนี้ไม่ใช่ตำรา” (p.xv)

สถิติเปลือยเปล่าผ่านแนวคิดพื้นฐานทางสถิติ (หมายถึงค่าเบี่ยงเบนมาตรฐานความสัมพันธ์การถดถอยเชิงเส้นการทดสอบการออกแบบการสำรวจ) ให้ความเป็นไปได้ในการโปรยพื้นหลังความเป็นไปได้ (แบบจำลองการนับและทฤษฎีขีด จำกัด กลางซึ่ง Wheelan ถือว่าเป็นส่วนหนึ่งของสถิติ) และใช้บทที่เหลือเตือนผู้อ่านเกี่ยวกับความผิดพลาดที่อาจเกิดขึ้นของแบบจำลองและเครื่องมือทางสถิติหากนำไปใช้ในสถานการณ์ที่ไม่ถูกต้องหรือข้อมูลผิดประเภท (มีกราฟอยู่สองสามกราฟ แต่ไม่ได้สร้างแรงบันดาลใจเป็นพิเศษ) ทั้งหมดนี้ทำด้วยสูตรคณิตศาสตร์ขั้นต่ำซึ่งส่วนใหญ่ซ่อนอยู่ในเชิงอรรถและภาคผนวก (แต่แล้วทำไมต้องเพิ่มสูตรพิเศษสำหรับσเมื่อได้รับมาก่อนหน้าสำหรับ²²) บางครั้งค่าต่ำสุดไม่เพียงพอดังที่แสดงโดย“ สูตรคำนวณค่าสัมประสิทธิ์สหสัมพันธ์” (หน้า 65) หน้าของข้อความเพื่อหลีกเลี่ยงเรื่องไร้สาระที่ไม่ได้ใช้สัญลักษณ์คณิตศาสตร์อย่างเช่น conclud และสรุปด้วยความอ่อนแอ“ ฉันจะโบกมือของฉันและปล่อยให้คอมพิวเตอร์ทำงาน” (หน้า 61)! อย่างน่าประหลาดใจเนื่องจากลักษณะที่มีความสำคัญต่ำของหนังสือเล่มนี้จึงมีภาคผนวกสุดท้ายเกี่ยวกับซอฟต์แวร์ทางสถิติ จาก Excel ไปยัง SAS, Stata และ ... R! ในขณะที่ฉันยินดีที่รวมนี้มันฟังดูมาก orthogonal เพื่อวัตถุประสงค์และผู้ชมตั้งใจของ Naked สถิติ ฉันไม่สามารถเข้าใจได้ว่าใครก็ตามที่อ่านหนังสือแล้วเริ่มลงมือทันทีเมื่อเขียนรหัส R โดยไม่หยุดโดยตำราเรียนสถิติหรือการฝึกอบรมอย่างเป็นทางการ (โดยบังเอิญผู้เขียนทำซ้ำความสับสนตามปกติระหว่างฟรีและโอเพนซอร์สหน้า 259)

“ เพื่อมิให้คุณขว้างหนังสือข้ามห้องอีกครั้งฉันใส่สูตรไว้ในภาคผนวก” (p.159)


ในบทที่เกี่ยวกับการใช้แบบจำลองความน่าจะเป็นในทางที่ผิด (และสถิติ), สถิติเปลือยกายคาดการณ์ได้ว่าเป็นตัวอย่างของ อย่างใดอย่างหลีกเลี่ยงไม่ได้ The Black Swan ของ Nassim Taleb: ผลกระทบของสไลด์ที่ไม่น่าจะเป็นไปได้สูงที่จะจ่ายให้กับภรรยาของมัน (ในส่วนนี้ในบทนี้ฉันพยายามทำความเข้าใจกับประโยคที่น่าเหลือเชื่อ“ แม่ของฉันมีสามรูในหนึ่งเดียว” (หน้า 99) และทำไม่ได้จนกระทั่งฉันพบบน Google มันเป็นนิพจน์การเล่นกอล์ฟ…) ในขณะที่ หนังสือมีตัวอย่างมากมายในการใช้สถิติอย่างไม่เหมาะสมฉันไม่เชื่อว่านี่เป็นหนังสือที่มีความเกี่ยวข้องมากที่สุดโดยเฉพาะ เพราะโมเดลที่ไม่สมจริงเหล่านั้นแทบจะไม่ได้ขึ้นอยู่กับข้อมูลใด ๆ เลย

“The resulting performances will be closer to the mean.” (p.106)





ไม่มีความคิดเห็น: