ข้อสอบ PAT 1 เดือน ธ.ค. นี่มันยากเกินบรรยายจริง ๆ ครับ

กระทู้จากหมวด 'ETC' โดย ffpokemon, 13 กุมภาพันธ์ 2012.

  1. ffpokemon

    ffpokemon Editor

    EXP:
    1,691
    ถูกใจที่ได้รับ:
    79
    คะแนน Trophy:
    113
    ออกตัวก่อนว่าผมไม่ได้มีส่วนได้ส่วนเสียอะไรกับข้อสอบนี้นะครับ ไม่ได้เป็นเด็กแอดมิดชันปีนี้ทำไม่ได้แล้วมาบ่นแต่อย่างใด (ผมจบมหาลัยมาสองปีแล้วครับ)

    เรื่องมันมีอยู่ว่ามีน้องที่รู้จักหลายคนมาบ่นให้ฟังถึงข้อสอบแอดมิดชันปีหลัง ๆ ว่าไม่ได้มาตรฐานบ้าง ออกอะไรมาไม่รู้บ้าง ยากเกินบ้าง (ดังที่เราได้ยินข่าวในกรณี "นิดเป็นคนสวย" "ผ้าปูโต๊ะสีอะไร" "ใส่ถั่วเขียวได้กี่เม็ด")
    แต่กับข้อสอบ เดือนธ.ค.ปีที่ผ่านมา (ธ.ค. 55) นี่รู้สึกจะมีเสียงบ่นมากเป็นพิเศษ ผมก็เลยลองเซิร์จข้อสอบในอินเทอร์เน็ตมาลองทำดูครับ ที่ผมลองทำดูเป็นข้อสอบ PAT 1 คือวิชาคณิตศาสตร์

    (สามารถดูข้อสอบบางส่วนได้ใน http://www.pantip.com/cafe/wahkor/topic/X11650059/X11650059.html)

    ปรากฏว่าผมแทบช็อคครับ นี่มันเอาอะไรมาให้เด็กสอบกันแน่

    ถ้าหลาย ๆ ท่านเคยทำข้อสอบเอ็นทรานซ์ย้อนหลัง 10 ปีตอนสอบเข้ามหาลัยที่ขึ้นชื่อเรื่องความโหดหิน ผมขอบอกเลยว่าเอามาเทียบกับข้อสอบ PAT1 ที่ผ่านมา ข้อสอบเอ็นทรานซ์สุดโหดนั่นเป็นขนมไปเลยครับ

    ผมและเพื่อน ๆ จบได้เกียรตินิยมจากคณะวิทยาศาตร์กันมา เอาข้อสอบเอ็นทรานซ์ปีไหนมาให้พวกผมทำ ยังไงก็ได้ไม่ต่ำกว่า 90% แน่นอน (แหงล่ะ เอาบัณฑิตมาทำข้อสอบเอ็นฯ มันก็ต้องง่ายเป็นธรรมดา) แต่กับข้อสอบ PAT1 นี่ พูดตามตรง ผมยังกระอักเลยครับ ถ้ามีเวลาให้แค่ 3 ชั่วโมง ทำอัตนัย 25 ข้อ ปรนัย 25 ข้อ ด้วยความยากขอบ PAT1 คราวนี้ ให้ทำให้ทัน 70% ยังยากเลยครับ

    ผลสอบออกมา คะแนนเต็ม 300 มีคนได้เกิน 60 คะแนนไม่ถึง 10% ของจำนวนคนสอบทั้งหมด
    แถมสอบคราวนี้ใคร ๆ ก็สมัครได้ หมายถึงว่าพวกติวเตอร์ อาจารย์ ด็อกเตอร์ทั้งหลายไปสอบกันตรึม
    หมายความว่าดีไม่ดีเด็กที่ได้เกิน 60 คะแนนมีไม่ถึง 5% ของเด็กทั้งหมดด้วยซ้ำ

    ใครที่สงสัยว่ามันยากขนาดไหน ลองจับเวลาทำ 5 ข้อแรกดูครับ ว่าเป็นไปได้ไหมในเวลาข้อละ 6 นาที ถึงจะมีข้อง่ายอย่างข้อ 11 ข้อง่ายพวกนั้นก็ยังต้องใช้เวลาประมาณ 1 นาที (ในกรณีที่คุณเทพมาก)

    สุดท้ายข้อสอบแบบนี้ เด็กไม่เก่ง เด็กธรรมดา เด็กเก่ง สอบออกมาได้คะแนนเท่ากันหมดครับ (ทำไม่ได้เหมือนกัน) แยกแยะอะไรไม่ได้เลย ยกเว้นแยก 'เด็กเทพ' ออกมาจากเด็กสามพวกนี้ได้

    อดสูจริง ๆ ครับ กับระบบการศึกษาไทย ระบบแอดมิดชันยิ่งเปลี่ยนยิ่งเน่าขึ้นเรื่อย ๆ
  2. taleoftrue

    taleoftrue Well-Known Member

    EXP:
    900
    ถูกใจที่ได้รับ:
    52
    คะแนน Trophy:
    113
    ไม่รู้ทำไมต้องเปลี่ยนระบบด้วยแฮะ มาอีหรอบนี้รู้สึกว่าระบบเอนท์ฯแต่เดิมยังดูดีกว่าอีก =_="

    (แต่จริงๆจะระบบไหน แต่ออกข้อสอบมาไม่ดีก็พังไม่เป็นท่าล่ะนะ)
  3. Aki

    Aki Paradox Observer

    EXP:
    485
    ถูกใจที่ได้รับ:
    41
    คะแนน Trophy:
    48
    ในทางการวัดและประเมินผล เรียกว่า มีค่าอำนาจจำแนก (discriminative power) ต่ำครับ

    //ขอแว่บเข้ามาตอบ... จะมีคนบ่นว่าผมสาระไหมเนี่ย ?

    จริง ๆ แล้วเป็นความสงสัยใคร่รู้ส่วนตัวมานานแล้วครับ (ตั้งแต่เรียนคอร์สการวัดและการประเมินทางจิตวิทยา -- ซึ่งมันคาบเกี่ยวกับการวัดผลทางการศึกษาด้วยในส่วนของการวัดสัมฤทธิผลทางการเรียน (academic achievement test) เพราะมันเป็นส่วนหนึ่งของการพัฒนาแบบวัด)


    โดยหลักพื้นฐานของการวัดและการประเมินผลทางการศึกษาแล้ว ข้อคำถาม/ข้อกระทงที่ถูกคิดขึ้นในชุดแบบวัดทั้งหมดนั้นจะต้องถูกนำมาหาคุณภาพเครื่องมือก่อนทุกครั้งครับ เพื่อดูว่าเครื่องมือ (แบบทดสอบ/แบบวัด) นี้จะมีคุณภาพหรือมีความสามารถตรวจสอบได้ตรงตามวัตถุประสงค์ของเครื่องมือนั้น ๆ รึเปล่า

    -- หลักการทางวิชาการพื้นฐาน --
    ในแบบทดสอบทางวิชาการก็จะมีดัชนีทางสถิติสองตัวครับ คือ ค่าความยากง่าย (difficulty) และค่าอำนาจจำแนก (discriminative)
    ซึ่งผู้ออกแบบทดสอบจะต้องนำข้อคำถามทั้งหมดในแบบทดสอบไปใช้กับกลุ่มตัวอย่างจำนวนหนึ่ง (ซึ่งต้องเป็นตัวแทนของประชากรที่ดีโดยมีการคละทั้งเด็กเรียนเก่ง เด็กเรียนอ่อน) เพื่อดูว่าแบบทดสอบนี้มีความยากอยู่ในระดับที่ยอมรับได้หรือไม่? และข้อสอบเหล่านี้จำแนกเด็กกลุ่มเก่งออกจากเด็กกลุ่มอ่อนได้หรือไม่?

    (วันนี้มาแบบสรุปนะครับ)
    คราวนี้ปัญหาของข้อสอบมาตรฐานสากลพวกนี้จึงอยู่ที่ "ผู้ออกแบบทดสอบไม่สามารถหากลุ่มตัวอย่างที่จะนำมาใช้เพื่อตรวจสอบคุณภาพเครื่องมือได้" เพราะเราไม่อาจหยิบเด็กกลุ่มหนึ่งซึ่งต้องถูกทดสอบด้วยข้อสอบชุดนี้ มาทำข้อสอบชุดนี้ก่อนที่จะวัดผลจริงได้ ด้วยเหตุผลหลายอย่างเช่น
    1) เกิดความไม่เท่าเทียมในการสอบ
    2) ข้อสอบรั่ว
    3) อื่น ๆ

    และหากเราจะใช้เด็กกลุ่มที่เข้าไปในระบบมหาวิทยาลัยแล้ว ก็จะยังเจอปัญหาพวกนี้อยู่ดี เพราะ
    1) แม้จะเป็นระบบเอนทรานซ์สมัยก่อนก็ยังคงเจอปัญหานี้ เพราะว่า การสอบทำนองนี้เปิดกว้างให้กับหลายบุคคลครับ แม้กลุ่มที่ได้ศึกษาต่อแล้วก็มีสิทธิ์ที่จะเข้าสอบใหม่ การสุ่มเลือกคนกลุ่มนี้มาก็อาจทำให้เกิดปัญหาความไม่เท่าเทียมกันอยู่ดี
    2) ไม่ว่าเลือกใครเข้าไปเป็นกลุ่มตัวอย่างเพื่อทดสอบคุณภาพของเครื่องมือ ก็มีโอกาสทำให้เกิดปัญหาข้อสอบรั่วอยู่ดีครับ
    3) อื่น ๆ

    เพราะงั้นข้อสอบมาตรฐานเหล่านี้จะได้รับอิทธิพลจาก "การไม่สามารถหาคุณภาพของเครื่องมือในเชิงประจักษ์ได้" โดยตรง

    นี่คือสิ่งที่ผมสงสัยข้อแรก!!!
    ว่ามาตรฐานในการออกข้อสอบเพื่อใช้คัดเลือกบุคคลเข้าระบบอุดมศึกษาด้วยข้อสอบกลาง ผ่านการตรวจสอบดัชนีทางสถิติสองตัวนี้อย่างไร ?

    วิธีการที่ผมคิดว่าน่าจะอยู่ในกระบวนการแล้ว คือ...
    1) นำผลการสอบที่เกิดขึ้นมาวัดแล้วตรวจสอบ ดัชนีทั้งสองตัวนี้ในภายหลัง... ก็จะทราบผลและแนวโน้มของคุณภาพในข้อสอบของปีนั้น ๆ เพียงแต่ว่า
    มันไม่ได้แก้ปัญหาการสร้าง 'ดัชนีบ่งชี้มาตรฐาน' ของข้อสอบแต่ละปีที่จะให้นักเรียนทำอยู่ดี
    2) เทียบสัดส่วนของผู้ได้คะแนนมากและคะแนนน้อยในแต่ละรายวิชา... แต่โดยระบบการศึกษาของเราแล้ว สัดส่วนพวกนี้มีอคติจากปัจจัยแทรกซ้อนอื่น ๆ ที่เกี่ยวข้องจนไม่อาจเอามาใช้เป็นดัชนีกลางได้ ยกตัวอย่างเช่น (ผมเทียบตามระบบเอนทรานซ์เก่า) คะแนนวิชาคณิตศาสตร์ คะแนนเฉลี่ยอาจอยู่ที่ 25 ซึ่งต่ำกว่าคะแนนกลางของโค้งปกติ (ซึ่งควรจะอยู่ที่ 50) เพราะงั้นสัดส่วนของผู้ที่ได้คะแนนน้อยในแบบวัดนี้จริง ๆ แล้วถือเป็นกลุ่มมาตรฐานโดยเฉลี่ยของประชากรทั้งหมด (คนส่วนใหญ่ควรจะได้ 25 คะแนน ดังนั้นค่ากลาง 50 คะแนนจึงเป็นค่ากลางปลอมของกลุ่มประชากร แต่ผมจะอธิบายเหตุผลที่ยังใช้กันอยู่ในภายหลังครับ) ข้อสอบชุดนี้จึงไม่อาจแยกกลุ่มกลางออกจากกลุ่มต่ำได้ (ในเชิงประชากร) แต่แยกกลุ่มสูงออกจากกลุ่มกลางและกลุ่มต่ำได้

    สิ่งที่ผมตั้งข้อสังเกตในประเด็นนี้ก็คือ... ข้อสอบมาตรฐานพวกนี้มีแนวโน้มที่จะมีอคติทางประชากรตั้งแต่แรกแล้วครับ และไม่อาจแยกกลุ่มสูงออกจากกลุ่มต่ำได้จริงด้วย เพราะไม่ได้ผ่านการหาคุณภาพเครื่องมือ (อย่างต่ำก็ในดัชนีทางสถิติทั้งสองตัว) ของชุดข้อสอบตั้งแต่ต้น

    แม้แต่ระบบเอนทรานซ์ก็ตาม

    แต่มันไม่ใช่เรื่องไม่ถูกต้องหรือเรื่องผิดหลักการในแง่ของการประเมินครับ!!!
    เพราะโดยปกติการประเมินมาตรฐานจะไม่อิง "ความเท่าเทียมกันของประชากร" อยู่แล้ว

    แต่จะอ้างอิงจากเกณฑ์มาตรฐานอื่น ๆ แทน เช่น หลักสูตร เนื้อหา ตามความเหมาะสมของเกณฑ์ผู้ควรอยู่ในสถาบันอุดมศึกษา

    ผู้ออกข้อสอบจึงออกข้อสอบตามหลักสูตรและเนื้อหากลางซึ่งถือเป็นเกณฑ์หลักของการคัดเลือก

    การออกข้อสอบแบบที่ไม่สามารถหาคุณภาพเครื่องมือจากกลุ่มตัวอย่างของประชากรได้จึงต้องมีเกณฑ์ของเนื้อหา(ซึ่งจะนำมาออกข้อสอบ)ที่แม่นยำมาก

    ปัญหาจะเกิดขึ้นเมื่อ... เกณฑ์ของหลักสูตรไม่เป็นกลาง

    ชุดข้อสอบที่เกณฑ์เนื้อหาไม่เป็นกลาง มีการเปลี่ยนแปลงไปตามระบบ และตามปีอย่างรวดเร็ว จึงไม่อยู่ในกระบวนการเพื่อหามาตรฐานของเนื้อหา
    (โดยปกติแล้วเราสามารถนำข้อสอบชุดเก่าและชุดใหม่ มาหามาตรฐานกลางระหว่างความเหมือน ความเหมาะสม และแนวทางของหลักสูตรที่เกิดขึ้นได้ -- แต่ต่อเมื่อมีการใช้เกณฑ์เดิมในระยะหนึ่ง แต่เมื่อเนื้อหากลางเปลี่ยนอยู่เรื่อย ๆ เราจึงไม่อาจเทียบข้อสอบชุดเก่าและชุดใหม่เชิงคู่ขนาน (parallel) ซึ่งเป็นหนึ่งในกระบวนการหาคุณภาพของเครื่องมือเช่นเดียวกัน)

    เพราะงั้นนี่จึงเป็นเหตุเป็นผลพอสมควรที่ทำไมข้อสอบมาตรฐานกลางเดี๋ยวนี้จึงแตกต่างจากข้อสอบในยุคเอนทรานซ์ หรือข้อสอบมาตรฐานกลางอื่น ๆ เช่น ข้อสอบวัดความสามารถภาษาอังกฤษแบบสากล TOEFL, TOEIC, IELT หรือข้อสอบทางวิชาการซึ่งเป็นมาตรฐานระดับสากลอื่น ๆ เช่น SAT, GMAT

    เพราะข้อสอบพวกนี้... ไม่ได้มีเนื้อหาหรือเกณฑ์เปลี่ยนไปตามหลักสูตรที่ถูกปรับตามแผนนโยบายการศึกษาแต่ละปี หรือถูกปรับตามรัฐมนตรีกระทรวงศึกษาธิการ หรือถูกปรับตามรัฐบาล
    แต่เขาใช้การพัฒนาเนื้อหาทั้งเชิงคุณภาพและเชิงปริมาณร่วมกันมาอย่างต่อเนื่อง
    -- เชิงคุณภาพ คือ หมั่นตรวจสอบความเป็นกลางและความเหมาะสมของเนื้อหาในระดับหนึ่ง ๆ เป็นเกณฑ์ เช่น คนที่จะมีทักษะทางวิชาการโดยสากลแล้วจะต้องรู้เรื่องนี้ เข้าใจในประเด็นดังต่อไปนี้ โดยไม่ขึ้นกับระบบการศึกษาของประเทศหนึ่ง ๆ แต่ขึ้นกับเนื้อหาโดยรวมของรายวิชา
    -- เชิงปริมาณ คือ หมั่นตรวจสอบดัชนีทางสถิติเพื่อพัฒนาตัวชี้วัดความเป็นกลางของเครื่องมือต่อเกณฑ์ที่กำหนดขึ้น

    โดยส่วนตัว ผมคิดว่านี่เป็นข้อสังเกตว่าทำไมระบบการใช้ข้อสอบกลางเพื่อประเมินผลสัมฤทธิ์ทางการของนักเรียนในสมัยนี้ยิ่งแย่กว่าสมัยก่อน และในประเทศนี้ที่แย่กว่าประเทศอื่น

    จริง ๆ แล้วถ้าพูดเรื่องของการประเมินและการวัดผลยังมีอีกหลายประเด็นที่เข้ามาอยู่ในหัวผมอีกมากเลยครับ เช่น

    1) เราออกข้อสอบโดยผู้เชี่ยวชาญเพราะเชื่อมั่นมากเกินไปว่าพวกเขาเป็นผู้กำหนดขอบเขตของความเป็นสากลของข้อสอบได้ และเชื่อมั่นมากเกินไปว่าพวกเขามีความแม่นยำพอที่จะแปลงเนื้อหาทั้งหมดเชิงนามธรรมออกมาเป็นข้อสอบซึ่งเป็นตัวบ่งชี้เชิงรูปธรรม

    2) เราละเลยที่จะสนใจความเป็นกลางจาก "เนื้อหาทั้งหมด" (ซึ่งทำให้เราไม่ได้พัฒนาชุดข้อสอบแบบปีต่อปี และหาคุณภาพจากการใช้ผลสอบแต่ละครั้งเท่าที่ควร) แต่เรามองหาความเป็นกลางจาก "เนื้อหาหลักสูตรที่ถูกกำหนดขึ้น"
    -- เราไม่ได้มองว่า "เมื่อกำหนดขอบเขตของฟิสิกส์ทั้งหมดแล้ว... เนื้อหากลางควรจะอยู่ที่" แต่เรากลับมองว่า "เนื้อหาของวิชาฟิสิกส์ที่เด็กควรรู้ในปีนี้คือ..." และนั่นทำให้เราพลาดการพัฒนาการสร้างข้อสอบมาตรฐาน

    3) ข้อสอบพวกนี้ถูกกำหนด (ถอดออกมา) จากเนื้อหาและหลักสูตร
    เนื้อหาและหลักสูตรพวกนี้ถูกกำหนด (ถอดออกมา) จากนโยบายการศึกษาในแต่ละปี
    นโนบายการศึกษาในแต่ละปีถูกกำหนด (ถอดออกมาจาก) .........
    --> ผมไม่ใช่ผู้เชี่ยวชาญในแวดวงการศึกษาขนาดจะวิจารณ์ออกปากได้ถึงสิ่งที่เกิดขึ้น แต่ตามการรับรู้ของผู้เกี่ยวข้องกับระบบการศึกษา ผมว่า เรามุ่งเน้น "การบูรณาการแบบนามธรรม" มากเกินไป... เรามีดีแต่ปากว่า "การเรียนการสอนแบบนี้ผสานสหวิทยาการจากวิชานี้ควบคู่กับวิชานี้" โดยไม่ได้ดูเลยว่า "ผลที่เกิดขึ้นทำให้เด็กเกิดการเรียนรู้แบบบูรณาการตามสหวิทยาการรึเปล่า ?"
    เรามีแต่หลักการว่า "โดยกระบวนการแล้ว... มันเป็นสหวิทยาการ"
    แต่ผลล่ะ?

    "เทรนด์การศึกษาช่วงนี้ในประเทศนี้ คือ การสร้างระบบที่ดี สร้างนโยบายที่ดี -- ครูต้องทำวิจัยชั้นเรียน, นักนโยบายการศึกษาต้องหาทางเชื่อมโยงความรู้ต่าง ๆ ในการเรียนการสอน -- โดยไม่ได้ตรวจสอบผลอย่างจริง ๆ จัง ๆ และไม่ได้ให้คุณค่ากับการวัดและประเมินผลเท่าที่ควรด้วย"

    ถ้าหากอะไรจะล้มเหลว... ผมว่าอย่างหนึ่งเลยก็คือ
    เราล้มเหลวการประเมินระบบที่เราสร้างขึ้นมาอย่างเห็นได้ชัด

    เรามองตัวชี้วัดบางตัวโดดเด่นจนลืมตัวชี้วัดอื่น ๆ เช่น มองว่า นักเรียนประเทศเราได้เหรียญเงิน เหรียญทองโอลิมปิก แต่ไม่ได้มองว่า นักเรียนเกินครึ่งประเทศยังทำคะแนนข้อสอบกลางมาตรฐานตามเนื้อหาและหลักสูตรได้ไม่เกิน 50 เลย

    เราอยู่ในจุดบอด... เพราะคิดว่าประเทศเราดี หรือพยายามสร้างให้คนอื่นเห็นว่าประเทศเราไม่ได้ด้อยพัฒนา

    แต่โดยกระบวนการและผลลัพธ์แล้ว

    ผมว่า... ก็อย่างที่เราเห็น ๆ กันอยู่นะครับ
  4. ffpokemon

    ffpokemon Editor

    EXP:
    1,691
    ถูกใจที่ได้รับ:
    79
    คะแนน Trophy:
    113
    ท่านประทานวิเคราะห์ได้ลึกซึ้งมากครับ ทำให้ผมเข้าใจเรื่องแบบทดสอบและการวัดผลมากขึ้นพอสมควรเลยทีเดียว

    ประเด็น 1) 2) และ 3) นั้นผมเห็นด้วยอย่างมาก แต่อยากเพิ่มเติมครับ
    ว่าข้อสอบ admission ที่ออกมา 3-4 ปีหลังแย่กว่านั้นอีกครับ

    แม้ สทศ. จะออกมาบอกว่า "ออกโดยผู้เชี่ยวชาญ" "ออกตามหลักสูตร" แต่ความจริงแล้วมันไม่ใช่เลยครับ อย่าไปเชื่อลมปาก
    ข้อสอบเหล่านี้ผมมั่นใจเลยครับว่าไม่ได้ออกโดยผู้เชี่ยวชาญ มีที่ผิดเยอะมาก หลายข้อก็เฉลยผิด ยิ่งข้อสอบเลขปีก่อน ๆ นี่พลาดให้เห็นจะ ๆ + ตอบได้หลายคำตอบ
    ส่วนเรื่องออกตามหลักสูตรนี่ยิ่งไม่จริงแน่ แทบไม่มีเด็ก ม.6 คนไหนทำข้อสอบเลขปีนี้ได้ดีแน่ ขนาดเด็กโอลิมปิคยังกระอัก อาจารย์มหาลัยมาทำยังอ้วกเลยครับ ยังไม่รวมถึงข้อสอบประเภท ผ้าปูโต๊ะสีอะไร น้องนิดเป็นคนสวย น้องนกตีเทนนิส แช่ผ้ากี่นาที ฯลฯ ที่ไม่ต้องไปหาข้อมูลก็รู้ว่ามันไม่มีในหลักสูตรแน่ ๆ ครับ
  5. majungsudrid

    majungsudrid New Member

    EXP:
    23
    ถูกใจที่ได้รับ:
    2
    คะแนน Trophy:
    3
    ปลายปีนี้ผมก็ต้องสอบแล้ว จะหวังอะไรได้บ้างมั๊ยเนี่ยย เห้ออ..

Share This Page