주말에 녹취록 만드는 작업 하나 했는데
원래는 구글문서 '음성 입력' 기능 이용해서 손쉽게 할 생각이었는데
이 방법 저 방법 다 해 보다가
인식률이 안 좋아서 결국 일일이 받아써야 했습니다.
그래서 오늘은 구글문서 음성 입력 기능이 더 잘 이용하는 요령을 소개하려고 해요.
1. 일단 음질이 좋아야 합니다.
당연한 거겠지만 음질이 좋아야 합니다.
스마트폰이라면 더 가까이 두고, 이왕이면 녹음기를 쓰는 것이 좋습니다.
제가 처음 음성인력 기능 써 본 때가 방송용 녹화된 영상이었는데,
그래서 그런지 거의 90%는 인식되는 것 같았어요.
좋은 녹음기를 쓰세요.
그리고 말하는 사람이 발음이 좋으면 더 인식이 잘 되겠지요.
2. 말하는 속도가 일정한 것이 좋아요.
이번에 구글문서 이용이 어려워던 이유 가운데 가장 큰 이유 같은데
녹음한 분이 말 속도가 빨라졌다 느려졌다 하는 게 무척 심했어요.
말하다가 끝부분에서 "~라고 생각됩니다" 이런 식으로 말할 때는 사람이 말이 느려지게 마련이잖아요.
이런 술어 있는 부분만 인식률이 그마나 높고
나머지 부분은 말 속도가 왔다갔다 하니까 구글문서가 인식을 못 하는 것 같았어요.
쉽게 말해 교과서 읽듯이 읽는 사람이 인식률이 높을 것 같군요.
말하는 속도가 심하게 왔다리 갔다리 한다? 음성인식 일찌감치 포기하시고 그냥 타이핑하세요.
3. 음량을 크게 하는 것이 좋아요.
노트북에서 소리가 커져서 방 밖으로 나갈까 봐 음량을 중간으로 설정하다가 잘 안 되길래
음량을 맥스로 했는데 그랬더니 인식률이 높아지는 것 같았어요.
외부 스피커로 인식하는 게 아니라 내장 스피커로 설정하잖아요... 그래서 음량이 영향이 별로 없을 줄 알았는데
음량은 아무래도 커야 인식이 잘 되는가 봅니다. 맥스로 올리세요.
4. 플레이어에서 음성을 실행할 때 녹음된 말 속도보다 느리게 설정해 보세요.
이게 실은 무척 중요합니다. 그러기 위해서는 플레이어를 잘 선택해야 해요.
기본적으로 설치된 프로그램 중에는 윈도우미디어플레이어가 괜찮은데,
윈도우미디어플레이어- 고급기능-재생속도 설정을 열고 재생속도를 0.7, 0.6에서 0.9 사이에서 조정해 보면서 속도에 따라 음성 인식률이 얼마나 달라지는지 테스트를 해 보고 그 사람에 맞는 속도를 설정하고 나서 음성 인식을 해 보세요.
대개 0.75 정도도 무난합니다.
말이 아무리 빠르더라도 0.5까지 내려가면 마치 기계음처럼 이상하게 되어서 안 맞을 것이고요.
말 속도 1로 똑같이 해 두면 인식이 잘 안 될 때가 많습니다.
5. 멀리 가지 말고 노트북 옆에 붙어서 살펴보세요
음성 입력 기능을 켜면 마이크에 빨간 불이 들어오잖아요.
음성이 잘 인식될 때는 마이크에서 바깥쪽 방향으로 원형 동그라미가 퍼져 나옵니다.
인식이 잘 안 될 때는 마이크에 빨간 불만 들어와 있고 원형 동그라미가 퍼져 나오지 않아요.
그럴 때는 마이크를 껐다가 다시 켜세요. 그러면 원형 동그라미가 전보다 잘 퍼져 나갑니다.
그러니까 그냥 내버려 두지 말고 옆에 붙어 있으면서 인식이 잘 되는지 살펴보는 게 좋아요.
음성 입력 기능 이용하기 이런 순서 어때요?
음성 입력 기능을 이용할 때는
재생 속도를 낮추어 설정한 다음 음성 전체를 한꺼번에 인식을 받으세요.
전체 인식이 끝났으면
재생 속도를 0.8 정도로 느리게 설정해 놓고 다시 한 번 녹음을 죽 들어 가면서 인식되지 못한 말을 마저 타이핑해서 넣으세요.
이런 식으로 하면 두 번 재생만에 녹취를 끝낼 수 있습니다.
도움이 되는 자료였기를 바랍니다.
2023년 9월에 내용 추가
이것저것 해 보니까요
요즘에는 노트북에서 영상 틀어놓고, 핸드폰 삼성 갤럭시에서 삼성노트 연 다음에 마이크처럼 보이는 거 누르고 노트북 스피커에서 가까이 가져다대놓고 쓰고 있어요. 이건 속도를 0.9 정도 하니까 음성 인식 정도가 구글독스 저리가라 할 정도로 좋더라고요. 다만 내버려둔다고 지가 알아서 잘 인식하는 게 아니라서 옆에서 잘 지켜보다가 가끔씩 인식이 느려지면서 마이크가 비활성화되면 손가락으로 마이크를 활성화해야 해요. 이 방법이 훨 낫네요. 구글 독스 안녕~
2023년 11월에 내용 추가
제가 요즘 녹취하고 있는 건 좀 알아듣기가 어려운데 갤럭시 노트가 잘 인식을 못하더라고요. 그래서 고민하다가 검색 끝에 유튜브 자동스크립트를 해 보았어요. 크.. 이게 가장 좋아요. 비공개로 올리고... 스크립트가 바로 뜨는 게 아니라 30분 정도 기다려야 된다는 점 생각하면 됩니다. 그리고 유료회원 아니면 최대 15분만 가능합니다. 자동 스크립트 뜨면 옆에 시간도 자동 표시되는데 옆에 설정에서 보면 이 시간 표시도 지울 수 있어요. 써 본 중에 유튜브 자동스크립트가 가장 인식률이 좋습니다. 찾아보면 요령 나오니까 잘 따라해 보세요. 영상 자르는 거는 다음 팟인코더 구해서 하면 편하고요. 이제 영상 마저 자르러 가야 합니다. 갤럭시 노트도 안녕~
2024년 추가
클로바 노트 쓰세요. 진짜 짱입니다. 클로바 노트는 마침표까지 찍어 줘요.
2024. 4월 추가
음성은 클로바 노트 쓰시고요
영상은 다시 유튜브로.... 유튜브가 요즘에 에이아이 엔진을 업그레이드라도 했나 봐요 음성 인식이 전보다 훨씬 좋아졌네요. 네.. 음... 이런 말버릇까지 너무 세밀하게 녹취해서 그건 단점이지만 영상에서 다시 음성 추출하느니 그냥 유튜브로 녹취 뜨는 게 낫네요.