유돈
22
2019-06-28 14:46:40
7
547

음성 인식 기술 개발은


이제 막 음성인식 기술에 대해 관심이 생긴 초초초 뉴비입니다. 관련 책을 읽다가 궁금증이 생겨서 그런데


음성인식 기술을 연구하게 되면 주로 하게 하는 활동이 무엇 인가요?

음성정보의 확보가 핵심이라던데 


그럼 그 수많은 음성데이타를 일일히 확보하여 프로그램에 추가해주는 반복적인 일을 주로 하는건가요

아니면 언어의 수많은 변화들, 생성을 한번에 캐치하는 방법론을 개발을 할 수 있거나 실제로 하고 있는 건가요?


0
0
  • 댓글 7

  • ercnam
    2k
    2019-06-28 14:48:29

    옛날 어릴때 봤던 과학만화에서는

    음성인식? 사람마다 목소리 톤이고 뭐고 다 다른데 그걸 억덕게 다 입력해서 판별함?? 못함 ㅎㅎ

    이렇게 되있었던거같은 기억이 있는데


    지금은 뭐 시리라던가 보면 참 역시 .... 세상만사다 싶습니다. (딴소리)

    0
  • kinaan
    6
    2019-06-28 15:16:22

    신호처리쪽분들이 하시는것이 아닐지...

    0
  • Celsius
    629
    2019-06-28 15:18:55

    글쎄요

    음성인식연구를 해본사람 자체가 소수기 때문에 경험자의 답변은 어려울 거구요.

    제 생각으로는 Speech to Text 겠죠.

    사람이 말하는 자연어 음성 데이터를 텍스트 데이터로 변환하는 기능을 구현하는겁니다.

    물론 세상에는 다양한 언어가 있는만큼 각 언어에 따라 최적화한 알고리즘이 필요할거같구요


    구글 아마존 카카오 등 이미 구현된 기술들이 있으니 써보시면 좋을거같네요.

    0
  • 하오바오
    66
    2019-06-28 17:52:27

    구현된 모델에 다양한 데이터를 넣고 학습시키면서

    주어진 환경에서 더 나은 인식률이 나오도록 반복하고 파라미터 조정하는 일들을 합니다

    과거엔 음성데이터를 쉽게 획득할 수 있었는데 지금은 개인정보보호 때문에 음성데이터도 구매합니다

    Kaldi를 주로 사용하고 Tensorflow 쓰는데도 있습니다

    1
  • 유돈
    22
    2019-06-28 23:45:07 작성 2019-06-28 23:51:48 수정됨

    하오바오

    감사합니다! 파라미터를 조정한다라.. 더 궁금해지네요 이런건 대체 어디서 구체적으로 알 수 있을지

    0
  • 유돈
    22
    2019-06-28 23:56:28

    Celsius

    답글 감사드립니다!

    그런데 음성인식연구인력이 많이 희귀한 편인건가요?

    아니면 그 쪽분야 자체가 정형화 되지 않았기 때문인가요?

    0
  • vollfeed
    852
    2019-07-01 10:21:02

    흔히 사용하는 음성인식은 단순히 한 기술이 아니고 여러 기술의 복합체입니다.

    우선 소리에도 파장, 진폭, 주기 등등 여러 요소가 있는데, 이걸 분석해서 적절한 글자로 바꿉니다.

    이 단계만 고유의 영역으로  머신러닝이 필수죠.


    두번쨰로 받아쓰기된 텍스트에 대해서 오류 검정, 수정합니다. 

    노이즈도 들어갈수도 있고, 본래 사람의 소리내어 읽기는 여러 예외 발음등 글자 그대로 읽는 경우가 아닐떄도 있습니다.

    그래서, 사전, 연관어 등등을 이용해서, 받아쓰기를 수정해줍니다. 초등학생의 받아쓰기 채점해준다고 보면됩니다.


    이제 그럭저럭 괜찮은 문장이 되면, 그떄부터는 그냥 자연어 검색입니다. 

    형태소 분석등을 해서 처리하는 경우도있고, 뭐, 이 쪽도 여러가지 있으니까 찾아보세요. 



    0
  • 로그인을 하시면 댓글을 등록할 수 있습니다.