halo, selamat pagi. permisi, mau nanya. sblmnya terima kasih. saya kan nulis command: #Function to ngram def get_top_n_gram(corpus,ngram_range,n=None): vec = CountVectorizer(ngram_range=ngram_range,stop_words = 'indonesian').fit(corpus) bag_of_words = vec.transform(corpus) sum_words = bag_of_words.sum(axis=0) words_freq = [(word, sum_words[0, idx]) for word, idx in vec.vocabulary_.items()] words_freq =sorted(words_freq, key = lambda x: x[1], reverse=True) return words_freq[:n] #n2_bigram n2_bigrams = get_top_n_gram(tw_list['text'],(2,2),20) n2_bigrams trus eror kek gini: ValueError: not a built-in stop list: indonesian. saya udah nyari di stackoverflow tpi saya kurang paham. Dalam stackoverflow diberitahu bahwa 'bahasa Inggris' saat ini adalah satu-satunya nilai string yang didukung. tapu referensi yang saya baca di stackoverflow blg bahwa ad banyak bahasa tersedia dan bahasa Indonesia adalah salah satunya, tapi kenapa erornya blg bukan built stop?? ada gak cara pake stopword dalam bahasa indonesia karena dataset yang saya gunakan dalam bahasa indonesia
0 jempol
bramanto
300
1157
·
3 tahun, 4 bulan yang lalu
·
0 jempol
Halo coder @gaktau, apakah kamu sudah mencoba beberapa referensi berikut? https://rahmadya.com/2019/04/24/... https://medium.com/@ksnugroho/da... Semoga membantu..