diff options
Diffstat (limited to '_content/blog/normalization/index.adoc')
| -rw-r--r-- | _content/blog/normalization/index.adoc | 26 |
1 files changed, 13 insertions, 13 deletions
diff --git a/_content/blog/normalization/index.adoc b/_content/blog/normalization/index.adoc index a49566b..8aec8eb 100644 --- a/_content/blog/normalization/index.adoc +++ b/_content/blog/normalization/index.adoc @@ -1,29 +1,29 @@ = Normalisasi teks dalam Go -:author: Marcel van Lohuizen -:date: 26 November 2013 +Marcel van Lohuizen +26 November 2013 :toc: == Pendahuluan Pada -link:/blog/strings[artikel] +link:/blog/strings[artikel^] sebelumnya kita telah membahas tentang string, byte, dan karakter dalam Go. Saya telah bekerja dengan banyak paket-paket untuk pemrosesan teks multibahasa untuk repositori teks Go. Beberapa paket tersebut layak memiliki artikel sendiri yang terpisah, tetapi sekarang saya ingin fokus pada -https://godoc.org/code.google.com/p/go.text/unicode/norm[go text/unicode/norm] +https://pkg.go.dev/code.google.com/p/go.text/unicode/norm[go text/unicode/norm^] yang menangani normalisasi, topik yang disinggung dalam -link:/blog/strings[artikel tentang string] +link:/blog/strings[artikel tentang string^] dan subjek dari artikel ini. Normalisasi bekerja pada tingkat paling atas dari abstraksi bukan pada byte mentah. Untuk belajar tentang normalisasi, -http://unicode.org/reports/tr15/[Annex 15 dari Standar Unicode] +https://unicode.org/reports/tr15/[Annex 15 dari Standar Unicode^] adalah bacaan yang bagus. Artikel yang lebih awam yaitu -http://en.wikipedia.org/wiki/Unicode_equivalence[halaman Wikipedia]. +https://en.wikipedia.org/wiki/Unicode_equivalence[halaman Wikipedia^]. Di sini kita fokus tentang bagaimana normalisasi bekerja dalam Go. @@ -74,7 +74,7 @@ Seperti yang telah dijelaskan juga dalam artikel tentang string, Go tidak menjamin bahwa karakter-karakter dalam sebuah string telah dinormalisasi. Namun, paket go.text dapat mengompensasi hal tersebut. Misalnya, paket -https://godoc.org/code.google.com/p/go.text/collate[collate], +https://pkg.go.dev/code.google.com/p/go.text/collate[collate^], yang dapat mengurutkan string menurut bahasa tertentu, bekerja secara tepat dengan string yang tidak dinormalisasi. Paket-paket dalam go.text tidak selalu membutuhkan input yang telah @@ -85,7 +85,7 @@ Normalisasi ada biayanya namun ia cepat, terutama untuk pemeriksaan dan pencarian atau jika sebuah string bukanlah NFD atau NFC dan bisa dikonversi ke NFD dengan melakukan dekomposisi tanpa mengubah urutan byte-byte. Secara praktik, -http://www.macchiato.com/unicode/nfc-faq#TOC-How-much-text-is-already-NFC-[99.98%] +https://www.macchiato.com/unicode/nfc-faq#TOC-How-much-text-is-already-NFC-[99.98%^] isi halaman HTML di web dalam bentuk NFC (bila mengikutkan _markup_, nilai persentase akan lebih besar). Sejauh ini umumnya NFC dapat di-dekomposisi ke NFD tanpa perlu mengubah urutan @@ -178,7 +178,7 @@ Atau Anda bisa mengeluarkan teks sebagai NFC seperti yang kebanyakan orang lakukan. Untuk menulis teks sebagai NFC, gunakan paket -https://godoc.org/code.google.com/p/go.text/unicode/norm[unicode/norm] +https://pkg.go.dev/code.google.com/p/go.text/unicode/norm[unicode/norm^] untuk membungkus `io.Writer`: ---- @@ -272,7 +272,7 @@ yang menghargai batasan karakter (seperti paket `go.text/search`.) Perkakas lain yang disediakan oleh paket `norm` yang bisa membantu bekerja dengan batasan karakter adalah iterator, -https://godoc.org/code.google.com/p/go.text/unicode/norm#Iter[norm.Iter]. +https://pkg.go.dev/code.google.com/p/go.text/unicode/norm#Iter[norm.Iter^]. Ia mengiterasi karakter satu-per-satu dalam bentuk normal. @@ -323,7 +323,7 @@ Tipe `norm.Properties` menyediakan akses ke informasi per-rune yang dibutuhkan oleh paket tersebut, yang paling terkenal yaitu _Canonical Combining Class_ dan dekomposisi informasi. Bacalah -https://godoc.org/code.google.com/p/go.text/unicode/norm/#Properties[dokumentasi] +https://pkg.go.dev/code.google.com/p/go.text/unicode/norm/#Properties[dokumentasi^] tipe tersebut jika Anda ingin belajar lebih dalam. @@ -370,4 +370,4 @@ waktu. == Artikel terkait -* link:/blogs/strings[String, byte, rune, dan karakter dalam Go] +* link:/blogs/strings[String, byte, rune, dan karakter dalam Go^] |
