Wakhinuddin’s Weblog


DEFINISI EVALUASI

DEFINISI EVALUASI
(Dalam Konteks Program dan Pendidikan)Oleh

Wakhinuddin S

Kata evaluasi berasal dari Bahasa Inggris evaluation yang berarti penilaian atau penaksiran, edangkan menurut pengertian istilah evaluasi merupakan kegiatan yang terencana untuk mengetahui keadaan sesuatu objek dengan menggunakan instrumen dan hasilnya dibandingkan dengan tolak ukur untuk memperoleh kesimpulan.
Evaluasi mengandung pengertian: suatu tindakan atau suatu proses untuk menentukan nilai dari sesuatu. Tujuan evaluasi pendidikan adalah kegiatan atau proses penentuan nilai pendidikan, sehingga dapat diketahui mutu atau hasil-hasilnya. Dalam proses penilaian, dilakukan perbandingan antara informasi-informasi yang telah berhasil dihimpun dengan kriteria tertentu, untuk kemudian diambil keputusan atau dirumuskan kebijakan tertentu. Kriteria atau tolak ukur yang dipegang tidak lain adalah tujuan yang sudah ditentukan terlebih dahulu sebelum kegiatan pendidikan itu dilaksanakan.
Dari aspek pelaksanaan, Evaluasi adalah keseluruhan kegiatan pengumpulan data dan informasi, pengolahan, penafsiran, dan pertimbangan untuk membuat keputusan. Evaluasi adalah kegiatan atau proses untuk mengukur dan selanjutnya menilai sampai dimanakah tujuan yang telah dirumuskan sudah dapat dilaksanakan. Evaluasi adalah proses memahami atau memberi arti, mendapatkan dan mengkomunikasikan suatu informasi bagi petunjuk pihak-pihak pengambil keputusan. Secara rinci dapat disampaikan.
1) Evaluasi ialah kegiatan mengumpulkan data seluas-luasnya, sedalam-dalamnya yang bersangkutan dengan kababilitas siswa, guna mengetahui sebab akibat dan hasil belajar.
2) Dalam rangka pengembangan sistem instruksional, evaluasi merupakan suatu kegiatan untuk menilai seberapa jauh program telah telah berjalan seperti yang telah direncanakan.
3) Evaluasi sebagai suatu alat untuk menentukan apakah tujuan pendidikan dan apakah proses dalam pengembangan ilmu telah berada dijalan yang diharapkan.
Evaluasi adalah suatu kegiatan yang direncanakan dengan cermat dan merupakan bagian yang integral dari kegiatan program/pendidikan. Evaluasi merupakan proses yang sistematis mulai dari menentukan tujuan (objektif) sampai menentukan keputusan, dimana prosesnya diawali dengan menentukan sasaran (objek) yang akan dievaluasi, menentukan instrumen (alat ukur), cara mengukur, mencatat data, menganalisis, menginterpretasi hasil analisis, mengambil kesimpulan dan menetapkan keputusan.
Dari pembahasan di atas dapat ditarik kesimpulan bahwa pengertian evaluasi adalah:
1) Merupakan suatu kegiatan yang direncanakan dengan cermat.
2) Kegiatan yang dimaksud merupakan bagian yang integral dari pendidikan, sehingga arah dan tujuan evaluasi harus sejalan dengan tujuan pendidikan.
3) Evaluasi harus memiliki dan berdasarkan kriteria keberhasilan yaitu keberhasilan dari: a) Belajar murid, b) Mengajar guru, dan c) Program pengajaran.
4) Evaluasi merupakan suatu tes maka evaluasi dilaksanakan sepanjang kegiatan program pendidikan dan pengajaran.
5) Evaluasi bernilai positif, yaitu mendorong dan mengembangkan kemampuan belajar siswa, kemampuan mengajar guru serta menyempurnakan program pengajaran.
6) Evaluasi merupakan alat (the means) bukan tujuan (the end) yang digunakan untuk menilai apakah proses perkembangan telah berjalan semestinya?
7) Evaluasi adalah bagian yang sangat penting dalam suatu sistem yaitu sistem pengajaran untuk mengetahui apakah sistem itu baik / tidak.
Berdasarkan beberapa rumusan di atas dapat didefinisikan bahwa evaluasi merupakan serangkaian kegiatan yang sistematis yang dilakukan dalam rangka untuk mengetahui apakah suatu kegiatm pendidikan telah berjalan sesuai dengan tujuan yang ditetapkan atau belum. Teknis pelaksanaan evaluasi meliputi penetapan objek yang akan dievaluasi, menentukan instrumen yang cocok dengan apa yang akan dievaluasi, melakukakn pengukuran terhadap objek evaluasi, mengumpulkan data hasil pengukuran data mengolah data yang didapatkan dari basil pengukuran. Berdasarkakn data pengukuran dapat dijadikan babagai rekomendasi yang dapat dijadikan sebagai dasar dalam menentukan keputusan.


12 Komentar so far
Tinggalkan komentar

isinya bagus, tapi pendapat dari siapa itu?

Komentar oleh HALIMAN

dapat dimengerti aku sangat berterimah kasih tetapi ada satu yang perlu diketahui menulis sesuatu untuk diperlihatkan harus disertai dengan sumber-sumber yang jelas. sebelumnya minta maaf

Komentar oleh elin

Banyak literaturnya, kt sintesa saja…

Komentar oleh wakhinuddin

bermanfaat bangat ni..
apakah sama evaluasi dengan peringkasan mateeri pembelajaran demi untuk mengetahui seberapa besar pendalamn ilmu dalam suatu pendidikan?

Komentar oleh aloisius

mantap

Komentar oleh Melki

maaf kalau boleh disertakan referensinya.. biar tidak plagiat

Komentar oleh Asa Fide Putra

Pernyataan ttg evaluasi sudah umum setiap buku evaluasi hampir sama; lihat Mehren, Gronlund, Stuflebeam, Algina, Dali, Djaali, Madaus Scriven, Rasch, dan banyak lainnya. Yang pernyataan saya hanya merupakan sintesa dari pendapat mereka dalam buku tersebut. Kalau sdr ingin baca silahkan cari sumber berikut.

Anderson, L W dan Krathwohl D R. (Ed.). A Taxonomy for Learning, Teaching, and Assesing. New York: Longman. 2001.

Aiken, L. R. Rating Scale and Checklist; Evaluation Behaviour, Personality, and Attitudes. New York: John Wiley & Sons, Inc. 1996.

Angoff, W.H. Scale, Norm, and Equivalent Score. Dalam Thorndike, R.L. Educational Mesurement. Washington: American Coucil On Education. 1971.

Ary, D; Jacobs, L.C; Razavieh. Pengantar Penelitian Dalam Pendidikan. Terjemahan oleh Arief Furchan.. Surabaya: Usaha Nasional.1982.

Athanasou, J dan Iasonas Lamprianou. A Theacher’s Guide to Assessment. Sydney: Social Science Press, 2002.

Baldwin, Thomas. S. Evaluation of Learning in Industrial Education, dalam Bloom, B.S; Hastings, J.T; Madaus, G.F. Handbook on Formative And Sumative Evaluation Of Student Learning. New York: McGraw-Hill Book Company.1973.

Barrett, S. Hec Lotto: Does Marker Variability Make Examinations A Lottery? University of South Australia. http://www.aare.edu.au/99pap/bar99789.htm.

………., The Impact of training on Rater Variability? University of South Australia. Iej.cjb.net.

Berk, Ronald A. A Guide to Criterion-Referenced Test Construction. Baltimore: The Johns Hopkins University Press. 1984.

Blank, W.E. Handbook for Developing Competency-Based Training Programs. New Jersey: Prentice-Hall, Inc. 1982.

Bloom, B.S; Hastings, J.T; Madaus, G.F. Handbook on Formative And Sumative Evaluation Of Student Learning. New York: McGraw-Hill Book Company.1973

Burke, K. The Mindful School : How to Assess Authentic Learning. Skylight Training and Publishing dan Hawker Brownlow Education. Australia. 1999.

Chapra, S C. dan Canale, R P. Metode Numerik, Jilid 1; Edisi kedua. Jakarta: Erlangga. 1989.

Chan, Wai. Analyzing Ipsative Data in Psychological Research. Hong Kong: The Chinese University of Hong Kong. 2003.

Corsini, R.J., Auerbach, A.J. Concise Encyclopedia of Psychology. New york: John Wiley & Sons, Inc.

Crocker, L; Algina, J. Introduction to Classical and Modern Test Theory. Chicago: Holt, Rinehart and Winston, Inc. 1986.

Cochran, W G. dan Cox, G M. Experimental Designs. New York: John Wiley & Sons. 1957.

de Gruijter, Dato N.M. dan Van der Kamp, Leo J. Th. Advances in Psychological and Educational Measurement. London: John Wiley & Sons. 1976.

……………, Statistical Test Theory for Education and Psychology.. May 2002. http://www.unt.edu/rss/class/rich/5840/test_theory_text.pdf.

Djaali,. Muljono, P., Ramly. Pengukuran Dalam Bidang Pendidikan. Jakarta: PPs UNJ. 2000.

Depdikbud. Kurikulum SMK, Bidang keahlian Teknik Mesin Program Keahlian Teknik Mekanik Otomotif. Jakarta: Depdikbud. 1999.

Depdiknas. Panduan Ujian Nasional dan Uji Kompetensi SMK 2002/20003. Jakarta: Depdiknas.

Depdiknas, Dir Jen Pendidikan Dasar dan Menengah, Direktorat Pendidikan Menengah Umum. Pengembangan Kurikulum & Sistem Penilaian Berbasis Kompetensi. Jakarta: Depdiknas. 2002.

Dietel, R J. Herman, J L. Knuth, R A. What Does Research Say About assessment?. North Central Regional Educational Laboratory (NCREL). Oak Brook. 1991. info@ncrel.org.

Fitzpatrick, R., Morrison E.J. Performance and Product Evaluation. Dalam Thorndike, R.L. Educational Mesurement. Washington: American Coucil On Education. 1971.

Gable, R.K. Instrument Development In The Affective Domain. Boston: Kluwer-Nijhoff Publishing. 1986.

Glass, G V. Standard and Criteria . Seri makalah. University of Colorado. http://www.wmich.edu/evalctr/pubs/ops/ops 10 htm.

Glass, G V, dan Hopkins K H. Statistical Methodes in Education And Psychology. New Jersey: Prentice-Hall, Inc. 1984.

Gronlund, N. E. How to Make achievement Test and Assessment. Boston: Ally and Bacon. 1993.

………………., Constructing Achievement Test. Englewood Cliffs: Prentice-Hall, Inc. 1982.

Guilford, J.P. Psychometric Methods. New York: McGraw-Hill Book Company, Inc. 1954.

Gustafsson, J. E., An Introduction to Rasch’s Measurement Model. New Jersey: ERIC. 1980.

Hambleton, R.K., Eignor, D.R. Competency Test Development, Validation, and Standard Setting, dalam Jaeger, R.M & Tittle, C.K. Minimum Competency Achievement Testing: Motives, Model, Measures, and Consequences. Berkeley: Mc Curtrhan Publishing Corporation.

Hambleton, R.K., Swaminathan, H., Rogers, H.J. Fundamentals of Item Response Theory. Newbury Park: SAGE Publications. 1991.

Hulin, C.L; Drasgow, P; Parsons, C.K. Item Response Theory; Aplication to Psychologycal Measurement. Illionois: Dow Jones-Irwin. 1983

Jaeger, R.M. Certication of Student Competency. Dalam Educational Measurement. Linn, R.L. Phonix: Oryx Press. 1993.

Landy, F. J., Trumbo, D. A. Psychology of Work Behavior. Illionis: The Dorsey Press. 1980.

Larson, M. E. Teaching Related Subjects in Trade and Industrial and Technical Education. Ohio: Charles E, Merrill Publishing Co.1972.

Linacre, John M. Facet: Minifac Rasch-Model Computer Programs. Chicago: Winsteps.com. 2004.

Livingston, S.A,. Zieky, M.J. Passing Score: A Manual setting Standards of Performance on Educational and Occupational Test. Princeton, N. J: Educational Testing Service, 1982.

Lord, F. M dan Norvick, M. R. Statistical Theories of Mental Test Score. Menlo Park, California: Addison-Weley Publishing Company, Inc. 1968.

Lunz, M.E., Wright, B.D., Linacre, J.M. Measuring The Impact of Judge Severity on Examination Scores. Pp. 1-2. http://www.rasch.org/memo47.htm.

Mardapi, D. Analisis Butir Dengan Teori Tes Klasik dan Teori Respons Butir. IKIP: Yogyakarta.

McGuigan, F.J,. Experimental Psychology Methodes of Research. New Jersey: Prentice Hall, Inc. 1983.

Mehren, W. A. dan Lehmann, I.J. Standardized Test in Educational. New York: Holt, Rinehart and Winston. 1980.

Mill, Craig N. A Comparison of Three Methods of Establishing Cut-Of Score On Criterion-Referenced Test, Journal of Educational Measurement, Vol.20, No. 3, Fall 1983.

Millman, J. Reliability and Validity of Criterion-Referenced Test Score. New Directions For Testing and Measurement, No. 4, 1979. San Francisco: Jossey_Bass Inc.

Naga, Dali S, Diktat perkuliahan ‘Psikometri’. Jakarta: Pascasarjana UNJ, 2001.

………………, Diktat perkuliahan ‘Teori Tes’. Jakarta: Pascasarjana, 2001.

………………, Pengantar Teori Sekor Pada Pengukuran Pendidikan. Jakarta: Gunadarma. 1992.

NATEF. ASE Program Certification Standards for Automobile General Service Technician Programs. 2003. Leesburg, VA. http://www.natef.orf.

Nitko, A.J. Educational Assessment of Student. Englewood Cliffs: Merrill, an imprint of Prentice Hall. 1996.

Owen, J.M., Program Evaluation : Form and Approaches. Sydney: Alen & Unwin. 1993.

Mislevy , R.J. et.al. Psychometric Principles in Student Assessment. Dordrecht, the Netherlands: Kluwer Acedemic Press. 2001.

Petersen, N. S., Kolen, M.J. dan Hoover, H.D. Scaling, Norming, and Equating. Dalam Educational Measurement. Linn, R.L. (Ed). Phonix: The Oryx Press. 1993.

Piper, D. Warren. Are Professors Professional? (Higher Education Policy Series; Vol.25). London: Jessica Kingsley Publishers.

Popham, W. James. Classroom assessment: What Teachers Need to Know. Los Angeles: Allyn and Bacon.

……………, (Editor). Evalution in Education; Current Application. Los Angeles: Mc Cutchan. 1974.

Puskur, Balitbang Dekdiknas. Ringkasan Penilaian Berbasis Kelas. Jakarta: Depdiknas. 2002.

Putrawan, Made, I. Pengujian Hipotesis; dalam Penelitian-Penelitian Sosial. Jakarta: Rineka Cipta, 1990.

Reeve, Bryce B. An Introduction to Modern Measurement Theory. (2004). Email: reeveb@mail.nih.gov.

Schumacker, Randal E. Reliability in Rasch Measurement: Avoiding The Rubber Ruller; makalah pada pertemuan tahunan American Educational Research Association. 25 April 2003. Chicago, Illinois. (http://www.coe.unt.edu/schumacker/Articles/Reliability%20in%20Rasch%20Measurement.pdf).

Shepard, L.S. Setting Performance Standars dalam Berk R.A. Ed, A Guide Criterion-Referenced Test Construction. Baltimore: The Johns Hopkins.1984.

Sherron, C T., Psychometric Development of the Adaptive Leadership Competency Profile. Disertasi pada University of North Texas. 2000. http://www.coe.unt.edu/allen/Dissertation-Exampler/ToddSherrondissertation.pdf.

Shrock, Sharaon A. dan Coscarelli, William C.C.. Criterion-Referenced Test Development: Technical and Legal Guidelines for Corporate Training. New York: Addison-Wesley Publishing Company Inc. 1989.

Sofyan, Herminarto. Pengaruh Strategi Pembelajaran Daya Gaya berfikir Siswa Terhadap hasil Belajar Motor otomotif. (Disertasi pada PPs UNJ). Jakarta. 2002.

Subkoviak, M. J. Reliability of Mastery-nonmastery Classifications; dalam Berk, R.A. Ed, A Guide to Criterion-Referenced Test Construction. Baltimore: The johns Hopkins university Press.

Sudjana. Disain dan Analisis Eksperimen. Bandung: Tarsito. 1988.

Sukamto. Perencanaan & Pengembangan Kurikulum Pendidikan Teknologi dan Kejuruan. Jakarta: Depdikbud. 1988.

Suparno, A. Suhaenah. Membangun Kompetensi Belajar. Jakarta: Dirjen Dikti Depdiknas. 2000.

Tay-Lim, B. S-H. et al. The Impact Treatments on NAEP Reporting Scale Secore, makalah pada National Council on Measurement in Education, 22-24 April 2003. Chicago:Educational Testing Service. http://www.ets.org/legal/copyright.

Thorndike, R.L. Aplliied Psychometrics. Boston: Hougton Mifflin Company, 1982.

Timpe, A. Dale; Ed. Kinerja (Performance). Jakarta: PT. Gramedia. 1992.

Wiersma, W. Jurs, S G. Educational Measurement and Testing. Boston: Allyn and Bacon. 1990.

Wright, B.D, IRT in The 1990s: Which Model Work Best?, 1992; http://www.rasch.org/rmt/contents.htm.

Komentar oleh wakhinuddin

terimakasih pak, sangat membantu buat Ananda..

Komentar oleh roni irawan

I read this piece of writing completely about the resemblance of latest and previous technologies,
it’s remarkable article.

Komentar oleh Chicago City Travel




Tinggalkan komentar