
Seekor zebra, yang merasa kesal karena sapi pemalas, segera melompati pagar. Eden mencoba mengubah soft rock di sekitarnya. Raksasa tinggi sering kali perlu istirahat, dan jalan terbuka tidak memungkinkan untuk berhenti. Ada beberapa antrean panjang di sana. Malam yang dingin cerah, bintang-bintang melayang, dan orang-orang memperhatikan. Beberapa pintu di dekatnya keluar. Banyak cahaya perlahan mencapai daratan, dan orang-orang merasakan keheningan yang mendalam. Teksnya berjalan dalam berbagai cara, maju tetapi benar. Melihat ke masa depan, segalanya terhenti dan impian tetap tersembunyi. Di sepanjang jalan, langit yang mendekat muncul, membentuk busur yang keras. Jauh di angkasa, layang-layang melayang dengan tenang, angin sepoi-sepoi bertiup sepoi-sepoi, dan persendiannya tersentak.
Apa istimewanya omong kosong di atas? Ini mencoba untuk mencocokkan distribusi rata-rata huruf dalam teks bahasa Inggris.
Artikel oleh Peter Norvig ini membahas studi frekuensi surat tahun 2012 menggunakan koleksi Google Buku. Distribusinya adalah sebagai berikut:
Untuk keperluan pemasangan font fallback (lebih lanjut tentang itu nanti), saya ingin paragraf pendek yang mewakili distribusi yang kira-kira serupa. Tentu saja, kita bisa membuat paragraf seperti “Zzzzzzzzz” (9 Z), diikuti 12 Q, dan seterusnya, hingga 1249 E. Tapi di mana kesenangannya? Selain itu, teks juga memiliki spasi dan tanda baca.
Jadi, setelah beberapa penyesuaian dan bimbingan dari kecerdasan buatan, paragraf tersebut terlihat lebih realistis dan sangat cocok dengan frekuensi huruf.
Berikut adalah file CSV yang ditampilkan:
- setiap huruf,
- Frekuensi Norvig (berdasarkan 3.563.505.777.820 huruf dalam kumpulan data) dan
- Begitu juga dengan frekuensi saya (berdasarkan 424 huruf saja, dikurangi spasi dan tanda baca)
Letter,Norvig,Tall giants E,12.49%,12.26% T,9.28%,8.73% A,8.04%,7.55% O,7.64%,7.08% I,7.57%,6.60% N,7.23%,7.55% S,6.51%,6.84% R,6.28%,6.13% H,5.05%,4.01% L,4.07%,4.48% D,3.82%,5.42% C,3.34%,1.89% U,2.73%,2.36% M,2.51%,2.12% F,2.40%,2.83% P,2.14%,2.59% G,1.87%,2.12% W,1.68%,2.12% Y,1.66%,2.12% B,1.48%,0.94% V,1.05%,0.94% K,0.54%,1.18% X,0.23%,0.47% J,0.16%,0.47% Q,0.12%,0.71% Z,0.09%,0.47%
Berikut adalah data yang sama yang direpresentasikan secara grafis:
Nah, apa gunanya?
Mirip dengan etaoin shrdlu yang tidak berarti yang digunakan oleh juru ketik, paragraf ini dapat digunakan untuk mengetahuinya lebar karakter rata-rata dari sebuah font.
Cukup render paragraf dalam elemen DOM blok sebaris yang tidak dibungkus, ukur lebar elemen dan bagi dengan panjang teks.
Apa gunanya? oke, atur size-adjust
Properti CSS untuk mencocokkan font cadangan untuk font web khusus. Artikel lanjutan akan segera dirilis, jadi pantau terus!
cukup dekat
Seperti yang Anda lihat pada gambar, kedua garis tersebut tidak sama persis. Saya rasa ini tidak masalah. Kecil kemungkinannya bahwa teks mana pun pada halaman tersebut akan memiliki distribusi huruf yang merata. Jadi mari kita bicara tentang perkiraan terlebih dahulu. Mungkin juga tergantung pada lokasinya. Misalnya, di situs dewasa, karakter X mungkin lebih sering muncul dibandingkan di buku biasa.
Analisis Norvig juga tidak menyebutkan spasi dan tanda baca. Dalam paragraf saya, ini ada, mungkin untuk mendekatkan teks rata-rata pada halaman.
Narator: Kenapa Bukan Lorem Ipsum Saja
Yah, itu tidak mencoba untuk mencocokkan distribusi karakter bahasa Inggris. (Ugh, itu bahkan bukan bahasa Inggris!)
Ini adalah apa yang tampak pada gambar yang sama:
CATATAN: Tidak ada K, J, Z, W atau Y.
Di bawah ini adalah statistik dalam format CSV dan .numbers untuk Anda teliti.
Semoga “zebra melompati pagar dengan cepat, tetapi sapi malas” akan selalu menguntungkan Anda!
Komentar? Temukan saya di BlueSky, Mastodon, LinkedIn, Threads, Twitter