Pada artikel kali ini saya membahas frekuensi huruf bahasa Inggris yang disarankan oleh penelitian Peter Norvig. Lalu saya berpikir…di mana bahasa ibu saya?
Jadi saya mendapatkan kumpulan 5.000 buku (832.260 kata), campuran penulis dan penerjemah Bulgaria, dan menghitung frekuensi surat. Berikut hasilnya dalam format CSV: letter.csv
Berikut adalah hasil pada grafik (dalam urutan abjad):
Bagan lain dengan data yang diurutkan berdasarkan frekuensi abjad:
ChatGPT memberikan hasil yang berbeda, bahkan mengejutkan (o adalah pemenang dengan 9,1%, a ketiga dengan 7,5%), yang membuat saya lebih memilih penelitian statistik alfabet 😀
Komentar? Temukan saya di BlueSky, Mastodon, LinkedIn, Threads, Twitter