Basic Technologies
인류 역사상 모든 아카이브와 데이터베이스보다 인터넷에 대한 지식이 더 많습니다.
THESEUS 프로그램은 미래에 이 지식들을 더 널리 이용할 수 있게 하는데 필요한 기본 기술 및 표준을 개발하고 있습니다. THESEUS는 정보의 의미를 포착하기 위한 의미론적 기술의 개발에 중점을 둡니다. 이를 통해 컴퓨터 프로그램은 텍스트, 이미지 및 사운드 및 비디오 레코딩의 컨텐츠를 자동으로 분석하고 링크하여 논리적 인 결론을 도출 할 수 있습니다.
이러한 인터넷의 진화를 가능하게하려면 기술 표준 및 혁신적인 기본 기술을 개발하는 것이 필수적이며 이러한 기술은 THESEUS 컨소시엄의 파트너가 6 가지 응용 시나리오에서 만들고 테스트합니다. 연구자들은 또한 인터넷에서 새로운 도구, 서비스 및 비즈니스 모델을 만드는데 가능한 빨리 이러한 기술을 사용하는 방법을 모색하고 있습니다.
기본 기술 개요
1. 자동으로 메타 데이터 생성하기
연구원들은 메타 데이터를 기반으로 미디어 컨텐츠를 이해하는 새로운 방법을 개발하고 있습니다. 메타 데이터는 데이터베이스에 포함 된 항목에 대한 정보를 포함합니다 (예 : 제작자 이름 또는 영화 촬영 기간). 이러한 새로운 방법을 사용하면 텍스트, 사진 및 오디오 및 비디오 파일을 비롯한 다양한 유형의 미디어 콘텐츠에 대한 메타 데이터를 만들 수 있습니다.
한 가지 초점은 메타 데이터를 자동으로 생성하는 방법을 찾는 것입니다. 다른 하나는 미디어 콘텐츠의 컨텍스트를 이해하기위한 의미론적 기술의 사용입니다.
목표는 다양한 출처에서 유사한 내용을 취하여 최대한 많은 정보를 사용자에게 제공하는 그룹으로 정보를 모으는 것입니다.
2. 멀티미디어 문서의 신속한 처리
사용자가 복잡한 멀티미디어 데이터베이스 검색 결과를 기다릴 때 불필요한 지연을 피하기 위해 THESEUS는 메타 데이터 생성을 위한 매우 효율적인 알고리즘을 개발하고 있습니다. 수십만 개의 항목이 포함 된 데이터베이스에서도 이미지와 비디오를 신속하게 검색 할 수 있습니다.
연구자들은 이미지 검색을 향상시키기 위해 컴퓨터가 사진이나 비디오의 물체를 식별 할 수 있게 해주는 이미지 인식 시스템을 개발하고 있습니다.
또 다른 초점 영역은 특히 이미지 파일에 대한 데이터 압축입니다.
3. 혁신적인 온톨로지(ontology) 관리
THESEUS는 컴퓨터가 컨텐트의 의미를 "이해"할 수 있게 해주는 소위 온톨로지에 기반해 시맨틱 기술을 연구하고 있습니다.
온톨로지는 주어진 주제 영역 내에서 개념적으로 지식을 표현하는 공식적인 지식 모델이며 의미의 수준에서 지식을 자동으로 처리 할 수 있게 해줍니다. 이는 인간만이 할 수 있었던 것입니다.
온톨로지 관리에 대한이 실무 그룹은 온톨로지의 설계 및 개발을 향상시키고 사용을 통한 자동 추론을 향상시키는 방법을 개발하고 있습니다.
4. 기계 학습
THESEUS는 온톨로지의 도움을 받아 수행되는 것처럼 모델링되고 구조화 될 수 있도록 데이터 관계 및 상호 연결의 자동 인식을 용이하게하는 지능형 데이터 분석 프로세스를 수행하고 있습니다.
이 방법은 텍스트, 이미지 및 오디오 및 비디오 데이터에 적용되며 서로 다른 유형의 데이터 간의 관계를 식별하는데 도움이됩니다.
5. 상황에 민감한 대화 처리
컴퓨터가 사용자 대신 행동 할 수 있으려면 사용자가 원하는 것을 이해해야합니다.
THESEUS 프로그램의 연구원은 사람과 기계 간의 이러한 대화를 용이하게 하기위해 다양한 응용 프로그램에 배포 할 수 있는 새로운 기능을 개발하고 있습니다. 혁신적인 알고리즘을 통해 음성, 제스처 및 기타 입력을 사용하여 제어 할 수 있는 멀티모드 사용자 인터페이스를 만들 수 있습니다.
이러한 인터페이스를 통해 사용자는 질의를 직관적으로 공식화하고 시스템과의 대화를 통해 이를 수정 할 수 있습니다. 컴퓨터 내의 특정 구성 요소는 멀티모드 사용자 인터페이스와 다양한 메타데이터 소스 간의 인터페이스 역할을 합니다. 검색을 실행하기 위해 음성 쿼리를 시스템에서 필요로 하는 의미적으로 적절한 데이터 레코드로 변환합니다.
6. 혁신적인 사용자 인터페이스
THESEUS는 데이터, 메타 데이터 및 문서 간의 관계를 보다 쉽게 식별 할 수 있도록 새로운 그래픽 사용자 인터페이스를 개발하고 있습니다.
예를 들어, 질의 결과는 지식 네트워크의 형태로 표현 될 수 있으며, 검색 네트워크는 검색 결과가 검색 용어 뿐만 아니라 서로 관련되어 있음을 보여줍니다.
이를 통해 사용자는 주제에 대한 명확한 개요를 제공하고 필요한 정보를보다 신속하게 찾을 수 있습니다.
7. 기본 기술 평가
전문가들은 THESEUS의 틀 내에서 개발 된 기본 기술의 품질을 평가하고 있습니다.
음성 및 이미지 인식 및 메타 데이터의 자동 분류에 대한 새로운 기술은 연구가 품질을 충족시킬 수 있도록 하기 위해 안정성, 기능 및 적합성을 결정하기 위해 테스트되고 있습니다.