소개

한국어 우선순위 단어를 제공하는 사이트 입니다.

한국 사람들이 가장 많이 사용하는 단어를 빅데이터 기술로 통계 냈습니다.

인터넷 신문, 인터넷 커뮤니티, 위키 데이터를 이용하였고 한글 데이터는 10GB를 수집하여 Word Count 하였습니다.

인터넷 신문사는 두군데로 10년치와 3년치를 수집하였고, 커뮤니티는 4군데 사이트에서 약 50여 카테고리 글 2~3년치를 수집하였습니다. 위키는 2016년 9월을 기점으로 위키 피디아와 나무위키 데이터 전체를 사용하였습니다.

한글 데이터 10GB를 책 한권 분략으로 환산 한다면 34,952권입니다. (10GB=10485760KB, 1권=300KB 기준)


한국어 공부하는데 많은 도움이 되길 바랍니다.

오로지 데이터만을 이용하여 단어 통계를 내었습니다. 정확하지 않는 내용이 있을 수 있으니 참고하여 봐주세요.


통합 단어를 기준으로 총 1,536,127의 단어가 정리되었습니다.

그 중에서 이 사이트에서 제공하는 단어는 9번 이상 언급된 241,210개의 단어 입니다.


메뉴 설명

Vocabulary : 각 카테고리 별로 전체 단어를 볼 수 있습니다

Today is vocab : 품사 별로 단어를 정리하여 하루 단위로 제공합니다


다음은 Count된 단어를 Chart로 표현했습니다.

전체 단어를 카운트한 그래프

상위 100 단어를 카운트한 그래프

단어 카운트 한 결과를 그래프로 그려보니 그 많은 데이터 중 결국 많이 사용하는 단어는 따로 있다는 것이 보입니다.


Introduce

A site that provides Korean priority words.

I collected the most used words from the Korean people.

This data was statistically analyzed by Big Data Technology.

Internet newspapers, Internet community, and Wiki data.

Word count was collected by collecting 10GB of Hangul data.

I have collected 10 years and 3 years of Internet newspaper in two places.

The community collected three years from four sites.

The wikipedia used all of the wikipedia and namuwiki data as of September 2016.

If you translate 10 GB of Hangul data into one volume of book, it is 34,952 books. (10GB = 10485760KB, one book = 300KB basis)


I hope to help you study Korean.

I used word data only with data. Please note that this may not be accurate.


A total of 1,536,127 words have been arranged based on the unified word.

Among them, the word provided on this site is 241,210 words mentioned more than 9 times.


Menu description

Vocabulary : You can see the whole word by each category.

Today is vocab : We organize words by parts of speech and provide them on a daily basis.


The next step is to represent the counted words in a chart.

A graph that counts the entire word.

A graph that counts the top 100 words.



사이트를 공개하며

사랑하는 아내와 곧 세상에 나올 구마와 함께 만들었습니다.

Hot Top 10

Rank

Word

POS