summaryrefslogtreecommitdiff
path: root/_content/blog/normalization/index.adoc
diff options
context:
space:
mode:
authorShulhan <m.shulhan@gmail.com>2021-10-10 20:40:34 +0700
committerShulhan <m.shulhan@gmail.com>2021-10-10 20:40:34 +0700
commitc4052c2b6a6b7b98a7df9025fb67d2ea04973b0c (patch)
tree4188d523a62f748c11e243e7ffa6c8d0d5c9db71 /_content/blog/normalization/index.adoc
parentfca4a9a741f51898c702fd512bda2dab876fd829 (diff)
downloadgolang-id-web-c4052c2b6a6b7b98a7df9025fb67d2ea04973b0c.tar.xz
semua: buat semua tautan eksternal dibuka di tab baru
Selain itu, ganti golang.org/pkg dan godoc.org dengan pkg.go.dev.
Diffstat (limited to '_content/blog/normalization/index.adoc')
-rw-r--r--_content/blog/normalization/index.adoc26
1 files changed, 13 insertions, 13 deletions
diff --git a/_content/blog/normalization/index.adoc b/_content/blog/normalization/index.adoc
index a49566b..8aec8eb 100644
--- a/_content/blog/normalization/index.adoc
+++ b/_content/blog/normalization/index.adoc
@@ -1,29 +1,29 @@
= Normalisasi teks dalam Go
-:author: Marcel van Lohuizen
-:date: 26 November 2013
+Marcel van Lohuizen
+26 November 2013
:toc:
== Pendahuluan
Pada
-link:/blog/strings[artikel]
+link:/blog/strings[artikel^]
sebelumnya kita telah membahas tentang string, byte, dan karakter dalam Go.
Saya telah bekerja dengan banyak paket-paket untuk pemrosesan teks
multibahasa untuk repositori teks Go.
Beberapa paket tersebut layak memiliki artikel sendiri yang terpisah, tetapi
sekarang saya ingin fokus pada
-https://godoc.org/code.google.com/p/go.text/unicode/norm[go text/unicode/norm]
+https://pkg.go.dev/code.google.com/p/go.text/unicode/norm[go text/unicode/norm^]
yang menangani normalisasi, topik yang disinggung dalam
-link:/blog/strings[artikel tentang string]
+link:/blog/strings[artikel tentang string^]
dan subjek dari artikel ini.
Normalisasi bekerja pada tingkat paling atas dari abstraksi bukan pada byte
mentah.
Untuk belajar tentang normalisasi,
-http://unicode.org/reports/tr15/[Annex 15 dari Standar Unicode]
+https://unicode.org/reports/tr15/[Annex 15 dari Standar Unicode^]
adalah bacaan yang bagus.
Artikel yang lebih awam yaitu
-http://en.wikipedia.org/wiki/Unicode_equivalence[halaman Wikipedia].
+https://en.wikipedia.org/wiki/Unicode_equivalence[halaman Wikipedia^].
Di sini kita fokus tentang bagaimana normalisasi bekerja dalam Go.
@@ -74,7 +74,7 @@ Seperti yang telah dijelaskan juga dalam artikel tentang string, Go tidak
menjamin bahwa karakter-karakter dalam sebuah string telah dinormalisasi.
Namun, paket go.text dapat mengompensasi hal tersebut.
Misalnya, paket
-https://godoc.org/code.google.com/p/go.text/collate[collate],
+https://pkg.go.dev/code.google.com/p/go.text/collate[collate^],
yang dapat mengurutkan string menurut bahasa tertentu, bekerja secara tepat
dengan string yang tidak dinormalisasi.
Paket-paket dalam go.text tidak selalu membutuhkan input yang telah
@@ -85,7 +85,7 @@ Normalisasi ada biayanya namun ia cepat, terutama untuk pemeriksaan dan
pencarian atau jika sebuah string bukanlah NFD atau NFC dan bisa dikonversi ke
NFD dengan melakukan dekomposisi tanpa mengubah urutan byte-byte.
Secara praktik,
-http://www.macchiato.com/unicode/nfc-faq#TOC-How-much-text-is-already-NFC-[99.98%]
+https://www.macchiato.com/unicode/nfc-faq#TOC-How-much-text-is-already-NFC-[99.98%^]
isi halaman HTML di web dalam bentuk NFC (bila mengikutkan _markup_,
nilai persentase akan lebih besar).
Sejauh ini umumnya NFC dapat di-dekomposisi ke NFD tanpa perlu mengubah urutan
@@ -178,7 +178,7 @@ Atau Anda bisa mengeluarkan teks sebagai NFC seperti yang kebanyakan orang
lakukan.
Untuk menulis teks sebagai NFC, gunakan paket
-https://godoc.org/code.google.com/p/go.text/unicode/norm[unicode/norm]
+https://pkg.go.dev/code.google.com/p/go.text/unicode/norm[unicode/norm^]
untuk membungkus `io.Writer`:
----
@@ -272,7 +272,7 @@ yang menghargai batasan karakter (seperti paket `go.text/search`.)
Perkakas lain yang disediakan oleh paket `norm` yang bisa membantu bekerja
dengan batasan karakter adalah iterator,
-https://godoc.org/code.google.com/p/go.text/unicode/norm#Iter[norm.Iter].
+https://pkg.go.dev/code.google.com/p/go.text/unicode/norm#Iter[norm.Iter^].
Ia mengiterasi karakter satu-per-satu dalam bentuk normal.
@@ -323,7 +323,7 @@ Tipe `norm.Properties` menyediakan akses ke informasi per-rune yang dibutuhkan
oleh paket tersebut, yang paling terkenal yaitu _Canonical Combining Class_
dan dekomposisi informasi.
Bacalah
-https://godoc.org/code.google.com/p/go.text/unicode/norm/#Properties[dokumentasi]
+https://pkg.go.dev/code.google.com/p/go.text/unicode/norm/#Properties[dokumentasi^]
tipe tersebut jika Anda ingin belajar lebih dalam.
@@ -370,4 +370,4 @@ waktu.
== Artikel terkait
-* link:/blogs/strings[String, byte, rune, dan karakter dalam Go]
+* link:/blogs/strings[String, byte, rune, dan karakter dalam Go^]