MBUX 사용성 분석

벤츠 S-class 2021년 차량의 음성 어시스턴트 시스템에 대한 분석

MBUX 사용성 분석
📅기간: 2021-01-12 ⭢ 2021-03-18
🤝고객: 사내 프로젝트
🖥️업무: UX 리서치
🎯기여도: 20%

💡 프로젝트 목표

벤츠 S-class 2021년 차량의 음성 어시스턴트 시스템에 대한 분석

💡 접근 방법

차량용 음성 인터페이스는 보수적으로 발전해 왔습니다. 초기에는 기능 조작 중심으로 보조수단 역할을 해왔기 때문에 얼마나 많은 기능을 얼마나 잘 인식하는지에 대한 비교가 관건이었습니다. 하지만 Car Play, Android Auto 이후 자연어 인식 기능이 도입되고 몇 년 후, 카메이커들은 어시스턴트에 퍼소나를 부여하기 시작합니다. 때문에 어시스턴트가 어떤 대화전략을 사용하는지 비교/분석할 수 이도록 기준을 마련해야 했습니다.

또 향후 분석에도 사용할 수 있도록 대표 대화를 기록하여 분석 보고서를 만들어낼 수 있는 프레임워크를 만들었습니다.

💡 결과

  • 15개의 예시 질문으로 이루어진 대화 기록 시트 (한국어/영어) 작성
  • 다음에 대한 분석 보고서 제출
    1. 음성 에이전트 활성화 방식
    • 사용자 명령 인식 방법 및 특징
    • 음성 에이전트 응답 방식 및 특징
    • 의인화 전략 (Anthropomorphism Strategy)
    • 개인화 전략 (Personalization Strategy)

보고서 샘플

기술적 동향

벤츠는 2021년 1월, CES 2021에서 2세대 MBUX 하이퍼스크린(MBUX Hyperscreen)을 공개하면서 “Mercedes Travel Knowledge”라는 새로운 기능을 소개했습니다. 지도 데이터와 주변 환경을 평가하고 개별 건물이나 관심 지점에서 전체 도시에 이르기까지 경로를 따라 흥미로운 랜드마크에 대한 많은 정보를 제공하는 기능으로, 음성 어시스턴트에게 다음과 같이 질문할 수 있습니다. “Hey Mercedes, what can you tell me about this building?” “Hey Mercedes, what is the name of the restaurant on the left?”

1. 음성 에이전트 활성화 방식

벤츠의 음성 에이전트는 음성 에이전트 대화 활성화에 있어서 특정 명령어를 통해 제어하는 Command-and-Control 방식을 통해 사용자가 먼저 대화를 시작하는 일반적인 방식을 사용하고 있습니다.

특징

벤츠의 음성 에이전트는 Wake up word와 Push-to-talk과 함께 별도 호출어 없이도 작동시킬 수 있는 ‘미니 저스트 토크(Mini Just Talk)’기능을 제공합니다. 이는 내비게이션 경로 안내를 실행하거나 라디오 채널 설정 등 차량 내 일부 기능에서 사용 가능합니다. 또, 대화가 끝난 직후, 다음 명령어를 말해 연속적인 사용이 가능합니다. 볼륨, 온도조절 등 연속적 조작 기능에서 유리할 것으로 생각됩니다.

4. 의인화 전략 (Anthropomorphism Strategy)

퍼소나 (Persona) 벤츠의 음성 에이전트는 한국어를 기준으로 젊은 여성의 목소리를 가지고 있습니다. 또한 다음과 같은 대화를 통하여, 음성 에이전트의 모습을 짐작해볼 수 있습니다.

User: 넌 누구니?

System: 전 인공지능 비서에요.

User: 좋아하는 색이 뭐야?

System: 당연히 실버죠. / 초록색이 가장 좋아요. 특히 신호등 앞에서요.

User: 고마워 / 잘했어.

System: 별 말씀을요. 필요 하실 때 언제든 불러주세요. / 정말요? 이렇게 잘 했다고 칭찬을 받으니까 너무 좋아요.

위의 대화에서 벤츠의 음성 에이전트는 자신을 ‘인공지능 비서’라고 소개하고 있습니다. 인간적인 설정을(자신이 20대라고 대답, 종아하는 노래와 취미를 대답함) 가지고 있으나 시리나 알렉사처럼 이름을 가지지 않으며, 기능적인 면을 먼저 소개하여 반-인격적인 느낌을 주고 있습니다. 한편 ‘초록 신호를 좋아’한다는 응답에서 일으키는 운전자와의 공감, 칭찬에 대한 정서적 교감을 통해 친근한게 느껴지는 대화 전략을 사용합니다. 적극적이지만 미숙한 점이 있는 퍼소나를 구성하여 사용자가 음성 에이전트의 오작동을 어느정도 받아들일 수 있도록 기대한 것으로 추측됩니다.