본문 바로가기

강연: 호갱노노 이렇게 만듭니다 발생일: 2020.11.26 키워드: 호갱노노, 삼성전자 내용: 삼성전자 R&D 센터에 초청받아 강연하고 왔다. R&D 센터는 이번이 두 번째 방문이다. 한 때 나름 인기가 많았던ㅎㅎ 코드리뷰 경험을 주제로 강연을 부탁받아서 다녀왔었다. 벌써 4년 전 일인데, 당시 환대해주셔서 특히 기억에 남는다. 올해는 개발 문화를 주제로 하는 전사 사내 컨퍼런스라고 소개받았다. 최근에 시간적인 여유도 조금 생겼고, 마음 편하게 다녀왔던 생각에 큰 부담을 갖지 않고 수락했다. 양재라서 가깝고 주차도 편했던 건 덤^^ 막상 수락하고 보니 어떤 내용을 공유할까 고민이 많았다. 삼성전자와 호갱노노는 규모나 업종, 프로세스나 성향까지 크게 달라서, 개발 문화가 의미있을까 싶기도 했다. 고민 끝에, 호갱노노에서 개발자들이 직접.. 더보기
클럽하우스와 음성 데이터 발생일: 2020.02.03 키워드: 클럽하우스, clubhouse, voice data, voice recognition, 음성 인식 내용: 요새 클럽하우스가 인기인가보다. 음성 기반의 SNS 서비스이다. 초대 받아 들어가서 잠깐 체험만 해보았는데, 음성 데이터의 가치가 엄청날 것 같아 보인다. 얼마 전에 1조 가치로 투자 받았다는데, 이런 특징들이 클럽하우스의 내재 가치를 올려주었던 게 아닐까 생각해봤다. - 화자가 명확한 음성 데이터를 수집할 수 있다는 것 - 다자간 음성 대화를 주제별로 분류할 수 있는 것 음성 인식 시장에 대해 잠깐 검색해봤는데, 생각보다 훨씬 규모가 크고 다양하게 활용되고 있는 것 같다. 음성 인식 시장의 가치 - 음성 인식 시스템, 음성 지원 가상 비서, 소매, 은행, 커넥티.. 더보기
뉴스: GPT-Neo 를 개발하고 있다는 소식 발생일: 2020.02.04 키워드: GTP-3, GTP-Neo, NLP 내용: 화제가 됐던 NLP 모델인 GTP-3의 무료 복제본인 GPT-Neo 를 개발하고 있다는 소식 GPT-Neo - GTP-3 의 복제 버전을 무료 공개용으로 제작할 목적 - GTP-3는 현재 마이크로소프트가 독점 라이선스를 가지고 있음 - 올해 8월 초까지 완성할 계획으로 목표는 GTP-3와 동일한 수준으로 구현하는 것 - 파라미터 1750억개의 버전이 목표이고, 현재 파라미터 1000억개까지는 완료함 - 사회적 편견을 없애는데 주의를 기울이고 있음 - CoreWeave 라는 클라우드 서비스가 인프라를 무료로 제공해주기로 함 - 학습 데이터는 825GB - 텍스트 데이터셋, IRC 챗로그, 유튜브 자막, 의학 연구 보고서 등 -.. 더보기