More Info
KPOP Image Download
  • Top University
  • Top Anime
  • Home Design
  • Top Legend



  1. ENSIKLOPEDIA
  2. Model bahasa besar - Wikipedia bahasa Indonesia, ensiklopedia bebas
Model bahasa besar - Wikipedia bahasa Indonesia, ensiklopedia bebas

Model bahasa besar

  • Afrikaans
  • Aragonés
  • العربية
  • Azərbaycanca
  • Boarisch
  • বাংলা
  • Bosanski
  • Català
  • کوردی
  • Čeština
  • Dansk
  • Deutsch
  • Ελληνικά
  • English
  • Esperanto
  • Español
  • Euskara
  • فارسی
  • Suomi
  • Français
  • Gaeilge
  • Galego
  • עברית
  • हिन्दी
  • Magyar
  • Հայերեն
  • Ido
  • Italiano
  • 日本語
  • Qaraqalpaqsha
  • Қазақша
  • 한국어
  • Македонски
  • Монгол
  • Nederlands
  • Norsk nynorsk
  • Norsk bokmål
  • Polski
  • Português
  • Runa Simi
  • Română
  • Русский
  • Simple English
  • Slovenščina
  • Shqip
  • Српски / srpski
  • தமிழ்
  • తెలుగు
  • ไทย
  • Tagalog
  • Türkçe
  • ئۇيغۇرچە / Uyghurche
  • Українська
  • Tiếng Việt
  • 中文
  • 文言
  • 閩南語 / Bân-lâm-gí
  • 粵語
  • IsiZulu
Sunting pranala
  • Halaman
  • Pembicaraan
  • Baca
  • Sunting
  • Sunting sumber
  • Lihat riwayat
Perkakas
Tindakan
  • Baca
  • Sunting
  • Sunting sumber
  • Lihat riwayat
Umum
  • Pranala balik
  • Perubahan terkait
  • Pranala permanen
  • Informasi halaman
  • Kutip halaman ini
  • Lihat URL pendek
  • Unduh kode QR
Cetak/ekspor
  • Buat buku
  • Unduh versi PDF
  • Versi cetak
Dalam proyek lain
  • Wikimedia Commons
  • Butir di Wikidata
Tampilan
Dari Wikipedia bahasa Indonesia, ensiklopedia bebas
Bagian dari seri
Pemelajaran mesin
dan Penggalian Data
Ilustrasi Jaringan saraf tiruan
Paradigma
  • Pemelajaran terawasi
  • Pemelajaran tak terawasi
  • Pemelajaran mesin daring
  • Pemelajaran mesin luring
  • Meta-learning
  • Pemelajaran semi terawasi
  • Pemelajaran terawasi mandiri
  • Pemelajaran pengukuhan
  • Pemelajaran berbasis aturan
  • Pemelajaran mesin kuantum
Masalah
  • Klasifikasi
  • Model generatif
  • Regresi
  • Kluster
  • Reduksi dimensi
  • Estimasi densitas
  • Deteksi anomali
  • Pembersihan data
  • AutoML
  • Aturan asosiasi
  • Analisis semantik
  • Rekayasa fitur
  • Pemelajaran fitur
Pemelajaran diawasi
(Klasifikasi • Regresi)
  • Pohon keputusan
  • Pemelajaran ensambel
    • Bagging
    • boosting
    • Random forest
  • k-NN
  • Regresi linear
  • Naive Bayes
  • Jaringan saraf tiruan
  • Regresi logistik
  • Perseptron
  • Support vector machine (SVM)
Kekelompokkan
  • BIRCH
  • CURE
  • Hierarki
  • k-means
  • Fuzi
Reduksi dimensionalitas
  • AKU
Jaringan saraf tiruan
  • Pemelajaran dalam
  • Jaringan saraf konvolusional
Diagnostik model
  • Kurva belajar
  • l
  • b
  • s

Model bahasa besar (bahasa Inggris: large language model, biasa disingkat LLM) adalah model bahasa berskala besar yang terkenal karena kemampuannya untuk mencapai tujuan umum dalam pemahaman dan pembangkitan bahasa. LLM memperoleh kemampuan ini dengan menggunakan data dalam jumlah besar untuk mempelajari miliaran parameter selama pelatihan dan mengkonsumsi sumber daya komputasi yang besar selama pelatihan dan pengoperasiannya. [1] LLM merupakan jaringan syaraf tiruan (umumnya menggunakan transformer [2]) dan telah dilatih sebelumnya atau di-(pre)trained dengan menggunakan pemelajaran terawasi mandiri dan pemelajaran semi terawasi.

Sebagai model bahasa yang bersifat autoregresif, LLM bekerja dengan menerima teks masukan dan memprediksi token atau kata selanjutnya secara berulang. [3] Sampai tahun 2020, fine tuning adalah satu-satunya cara suatu model bisa beradaptasi untuk bisa menyelesaikan tugas tertentu. Adapun model yang lebih besar, seperti GPT-3, dapat di-prompt-engineer untuk mencapai hasil yang sama. [4] LLM dianggap memiliki pengetahuan terkait sintaksis, semantik, dan ontologi yang melekat pada korpora bahasa manusia, tetapi LLM juga memiliki semacam ketidakakuratan dan bias yang ada dalam korpora. [5]

Contoh terkenal, termasuk model GPT oleh OpenAI (seperti, GPT-3.5 dan GPT-4, yang digunakan dalam ChatGPT), PaLM milik Google (digunakan dalam Bard), dan LLaMA milik Meta, serta BLOOM, Ernie 3. 0 Titan, dan Claude 2.

Referensi

[sunting | sunting sumber]
  1. ^ "Better Language Models and Their Implications". OpenAI. 2019-02-14. Diarsipkan dari versi aslinya tanggal 2020-12-19. Diakses tanggal 2019-08-25.
  2. ^ Merritt, Rick (2022-03-25). "What Is a Transformer Model?". NVIDIA Blog (dalam bahasa American English). Diakses tanggal 2023-07-25.
  3. ^ Bowman, Samuel R. (2023). "Eight Things to Know about Large Language Models". arΧiv:2304.00612 [cs.CL]. 
  4. ^ Brown, Tom B.; Mann, Benjamin; Ryder, Nick; Subbiah, Melanie; Kaplan, Jared; Dhariwal, Prafulla; Neelakantan, Arvind; Shyam, Pranav; Sastry, Girish; Askell, Amanda; Agarwal, Sandhini; Herbert-Voss, Ariel; Krueger, Gretchen; Henighan, Tom; Child, Rewon; Ramesh, Aditya; Ziegler, Daniel M.; Wu, Jeffrey; Winter, Clemens; Hesse, Christopher; Chen, Mark; Sigler, Eric; Litwin, Mateusz; Gray, Scott; Chess, Benjamin; Clark, Jack; Berner, Christopher; McCandlish, Sam; Radford, Alec; Sutskever, Ilya; Amodei, Dario (Dec 2020). Larochelle, H.; Ranzato, M.; Hadsell, R.; Balcan, M.F.; Lin, H. (ed.). "Language Models are Few-Shot Learners" (PDF). Advances in Neural Information Processing Systems. 33. Curran Associates, Inc.: 1877–1901.
  5. ^ Manning, Christopher D. (2022). "Human Language Understanding & Reasoning". Daedalus. 151 (2): 127–138. doi:10.1162/daed_a_01905. S2CID 248377870.
  • l
  • b
  • s
Pengolahan bahasa alami
Istilah umum
  • AI-komplit
  • Bag-of-words
  • n-gram
    • Bigram
    • Trigram
  • Linguistik komputasi
  • Pemahaman bahasa alami
  • Stop words
  • Text processing
Analisis teks
  • Collocation extraction
  • Concept mining
  • Coreference resolution
  • Deep linguistic processing
  • Distant reading
  • Information extraction
  • Named-entity recognition
  • Ontology learning
  • Parsing
  • Part-of-speech tagging
  • Semantic role labeling
  • Semantic similarity
  • Sentiment analysis
  • Terminology extraction
  • Text mining
  • Textual entailment
  • Truecasing
  • Word-sense disambiguation
  • Word-sense induction
Segmentasi teks
  • Compound-term processing
  • Lemmatisation
  • Lexical analysis
  • Text chunking
  • Stemming
  • Sentence segmentation
  • Word segmentation
Peringkasan otomatis
  • Multi-document summarization
  • Sentence extraction
  • Text simplification
Mesin penerjemah
  • Computer-assisted
  • Berbasis contoh
  • Berbasis aturan
  • Statistik
  • Berbasis transfer
  • Neural
Model Semantik distribusi
  • BERT
  • Document-term matrix
  • Explicit semantic analysis
  • fastText
  • GloVe
  • Language model
  • Latent semantic analysis
  • Seq2seq
  • Word embedding
  • Word2vec
Sumber bahasa,
datasets and corpora
Jenis dan
standar
  • Linguistik korpus
  • Sumber daya leksikal
  • Data Terbuka Bertautan Linguistik
  • Kamus yang dapat dibaca mesin
  • Teks paralel
  • PropBank
  • Jaringan semantik
  • Sistem Organisasi Pengetahuan Sederhana
  • Korpus ucapan
  • Korpus teks
  • Thesaurus (information retrieval)
  • Treebank
  • Ketergantungan Universal
Data
  • BabelNet
  • Bank of English
  • DBpedia
  • FrameNet
  • Google Ngram Viewer
  • UBY
  • WordNet
Identifikasi otomatis
dan pengambilan data
  • Pengenalan suara
  • Segmentasi ucapan
  • Sintesis ucapan
  • Generasi bahasa alami
  • Optical character recognition
Model topik
  • Document classification
  • Latent Dirichlet allocation
  • Pachinko allocation
Peninjauan
dengan bantuan komputer
  • Automated essay scoring
  • Concordancer
  • Grammar checker
  • Predictive text
  • Penilaian pengucapan
  • Pemeriksa ejaan
  • Sintaks menebak
Bahasa alami
antarmuka pengguna
  • Chatbot
  • Fiksi interaktif
  • Menjawab pertanyaan
  • Asisten virtual
  • Antarmuka pengguna suara
Related
  • Hallucination
  • Perangkat Bahasa Alami
  • spaCy
Diperoleh dari "https://id.wikipedia.org/w/index.php?title=Model_bahasa_besar&oldid=27476179"
Kategori:
  • Pemelajaran dalam
  • Pengolahan bahasa alami
Kategori tersembunyi:
  • Halaman dengan argumen ganda di pemanggilan templat
  • Pages using the JsonConfig extension
  • CS1 sumber berbahasa American English (en-us)

Best Rank
More Recommended Articles