ValueError: not a built-in stop list: indonesian. (Indonesian Stopword)

Oleh gaktau 0 0 pada Minggu, 20 Juni 2021, 07:02:23

Silahkan masuk untuk berdiskusi

halo, selamat pagi. permisi, mau nanya. sblmnya terima kasih. 

saya kan nulis command: 

#Function to ngram
def get_top_n_gram(corpus,ngram_range,n=None):
 vec = CountVectorizer(ngram_range=ngram_range,stop_words = 'indonesian').fit(corpus)
 bag_of_words = vec.transform(corpus)
 sum_words = bag_of_words.sum(axis=0) 
 words_freq = [(word, sum_words[0, idx]) for word, idx in vec.vocabulary_.items()]
 words_freq =sorted(words_freq, key = lambda x: x[1], reverse=True)
 return words_freq[:n]

#n2_bigram
n2_bigrams = get_top_n_gram(tw_list['text'],(2,2),20)

n2_bigrams


trus eror kek gini: 
ValueError: not a built-in stop list: indonesian. 

saya udah nyari di stackoverflow tpi saya kurang paham. Dalam stackoverflow diberitahu bahwa 'bahasa Inggris' saat ini adalah satu-satunya nilai string yang didukung. tapu referensi yang saya baca di stackoverflow blg bahwa ad banyak bahasa tersedia dan bahasa Indonesia adalah salah satunya, tapi kenapa erornya blg bukan built stop?? ada gak cara pake stopword dalam bahasa indonesia karena dataset yang saya gunakan dalam bahasa indonesia

0 jempol

bramanto
300

1168
· 5 tahun yang lalu · 0 jempol

Halo coder @gaktau, apakah kamu sudah mencoba beberapa referensi berikut?

https://rahmadya.com/2019/04/24/...

https://medium.com/@ksnugroho/da...

Semoga membantu..

bramanto 300 1168 · 5 tahun yang lalu · 0 jempol

bramanto
300

1168
· 5 tahun yang lalu · 0 jempol