Cs.MM

'Cs.MM' 카테고리의 모든 글

총 3개의 글
시간순 정렬
QoE 중심 360도 영상 라이브 스트리밍을 위한 연관 상행 및 하행 속도 조절 규칙

QoE 중심 360도 영상 라이브 스트리밍을 위한 연관 상행 및 하행 속도 조절 규칙

360도 비디오는 360도의 몰입형 시청 경험을 제공하며, 다양한 분야에서 널리 사용되고 있습니다. 360도 비디오 라이브 스트리밍 시스템은 캡처, 압축, 업링크(카메라에서 비디오 서버로), 다운링크(비디오 서버에서 사용자로) 전송을 포함합니다. 그러나 이러한 복잡한 시스템에 대해 공동으로 연구한 사례는 거의 없으며 특히 제한적인 대역폭 하에서 결합된 업링크와 다운링크의 속도 조절에 대한 연구가 부족합니다. 본 논문에서는 사용자의 실시간 시야(Field-of-View, FOV) 정보를 기반으로 비디오 서버에서 업링크 및 다운링크 대역폭을 고려한 속도 조절이 가능한 QoE(사용자 체험 품질)-중심의 360도 비디오 라이브 스트리밍 시스템을 제안합니다. 이를 비선형 정수 계획법 문제로 정식화하고, Karush-Kuhn-Tucker(KKT) 조건과 분지 경계 방법(branch and bound method)을 결합한 알고리즘을 제안하여 해결했습니다. 수치적 결과는 제안된 최적화 모델이 다른 기준 방안에 비해 사용자 QoE를 크게 향상시킬 수 있음을 보여줍니다.

paper AI 요약
가상현실에서의 지도와 구체

가상현실에서의 지도와 구체

이 논문은 가상현실(VR)에서 전 세계 지도를 표시하는 다양한 방법을 탐색합니다. 우리는 다음과 같은 네 가지 시각화 기법을 비교했습니다 (a) 사용자의 관점이 지구 밖에 위치한 3D 외적 지구; (b) VR의 평면에 렌더링된 평면 지도; (c) 사용자 관점이 지구 안에 있는 3D 내적 지구; 그리고 (d) 사용자가 중심을 기준으로 굴곡하는 구면 부위로 투영한 굽은 지도입니다. 모든 네 가지 시각화에서는 표준 손잡이 VR 컨트롤러를 통해 지리적 중심을 부드럽게 조정할 수 있으며, 사용자는 머리를 추적하는 헤드셋을 통해 물리적으로 시각화 주변을 이동할 수 있습니다. 거리 비교에서 외적 지구는 내적 지구와 평면 지도보다 정확합니다. 면적 비교에서는 더 많은 시간이 소요되며, 외적과 내적 지구보다 굽은 지도와 평면 지도가 더 빠릅니다. 방향 추정에서 외적 지구는 다른 시각화에 비해 더 정확하고 빠르게 작동합니다. 우리의 연구 참가자들은 약간의 선호도를 외적 지구에게 보였습니다. 일반적으로 굽은 지도는 평면 지도보다 이점을 가지고 있었습니다. 거의 모든 경우 내적 지구는 가장 효과적이지 않은 시각화로 판명되었습니다. 전체적으로 우리의 결과는 혼합현실에서 지리적 시각화를 위한 외적 지구의 사용을 지원합니다.

paper AI 요약
No Image

인도 에모스피치 명령 데이터셋 야외 환경에서 감정 기반 음성 인식을 위한 데이터셋

발화 감정 분석은 여러 응용 사례를 가능하게 하는 중요한 작업이다. 발화 내의 비언어적 소리도 발화에서의 감정 분석에 핵심적인 역할을 한다. 스마트폰의 광범위한 사용으로 인해 마이크로 녹음된 음성 명령을 이용하여 장치 내 머신 러닝 모델을 활용한 감정 이해가 가능하게 되었다. 비언어적 정보는 주변 환경 소리, 현재 상황 및 수행 중인 활동을 설명하는 배경 소리를 포함한다. 본 연구에서는 실제 시나리오에서 발화 내의 언어적(음성 명령)과 비언어적(배경 잡음) 소리를 모두 고려하여 감정 분석을 실시하였다. 이를 위해 인디언 에모스피치 커맨드 데이터셋 이라는 원천적인 데이터셋을 작성하였으며, 이는 다양한 감정과 배경 소리를 포함한 단어들을 통해 음성 분석의 새로운 과제를 탐색한다. 여러 성능 지표에 걸쳐 다양한 기저 모델들과 감정 분석에서의 비교를 철저히 수행하였다. 우리는 특정 음성 명령 데이터셋의 일부에 대한 키워드 인식에서 상위 한 개 점수로 3.3%의 유의미한 평균 성능 향상을 달성함을 보여준다.

paper AI 요약

< 카테고리 현황 (Total: 347) >

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키