Sormenjälki
- 1 Samanlaiset profiilit
Yhteistyöt ja huippututkimusalueet viimeisiltä viideltä vuodelta
-
Analysing Human-Generated Captions for Audio and Visual Scenes
Martin Morato, I., Ariyakulam Sudarsanam, P. & Virtanen, T., 2025, Workshop on Detection and Classification of Acoustic Scenes and Events 2025. DCASE, s. 85-89Tutkimustuotos: Konferenssiartikkeli › Tieteellinen › vertaisarvioitu
Open accessTiedosto3 Lataukset (Pure) -
AVCaps: An Audio-Visual Dataset With Modality-Specific Captions
Sudarsanam, P., Martin-Morato, I., Hakala, A. & Virtanen, T., 2025, julkaisussa: IEEE Open Journal of Signal Processing. 6, s. 691-704Tutkimustuotos: Artikkeli › Tieteellinen › vertaisarvioitu
Open accessTiedosto1 Sitaatiot (Scopus)61 Lataukset (Pure) -
Representation Learning for Semantic Alignment of Language, Audio, and Visual Modalities
Sudarsanam, P., Martín-Morató, I. & Virtanen, T., 2025, 2025 33rd European Signal Processing Conference, EUSIPCO 2025. IEEE, s. 51-55Tutkimustuotos: Konferenssiartikkeli › Tieteellinen › vertaisarvioitu
Open accessTiedosto1 Lataukset (Pure) -
Stereo Sound Event Localization and Detection with Onscreen/offscreen Classification
Shimada, K., Politis, A., Roman, I. R., Ariyakulam Sudarsanam, P., Diaz-Guerra Aparicio, D., Pandey, R., Uchida, K., Koyama, Y., Takahashi, N., Shibuya, T., Takahashi, S., Virtanen, T. & Mitsufuji, Y., lokak. 2025, Proceedings of the 10th Workshop on Detection and Classification of Acoustic Scenes and Events (DCASE 2025). DCASE, s. 140-144 4 SivumääräTutkimustuotos: Konferenssiartikkeli › Tieteellinen › vertaisarvioitu
Open accessTiedosto4 Lataukset (Pure) -
Baseline models and evaluation of sound event localization and detection with distance estimation in DCASE 2024 Challenge
Diaz-Guerra Aparicio, D., Politis, A., Ariyakulam Sudarsanam, P., Shimada, K., Krause, D., Uchida, K., Koyama, Y., Takahashi, N., Takahashi, S., Shibuya, T., Mitsufuji, Y. & Virtanen, T., 2024, Proceedings of the 9th Workshop on Detection and Classification of Acoustic Scenes and Events (DCASE 2024). DCASE, s. 41-45Tutkimustuotos: Konferenssiartikkeli › Tieteellinen › vertaisarvioitu
Open accessTiedosto168 Lataukset (Pure)
Tietoaineistot
-
Clotho-AQA dataset
Lipping, S. (Creator), Ariyakulam Sudarsanam, P. (Creator), Drossos, K. (Creator) & Virtanen, T. (Creator), Zenodo, 20 huhtik. 2022
DOI - pysyväislinkki: 10.5281/zenodo.6473207
Tietoaineisto: Dataset
-
STAIRS26: Sony-Tau Acoustic Images of Real-World Scapes 2026
Roman, I. R. (Creator), Politis, A. (Creator), Shimada, K. (Creator), Cheston, H. (Creator), Ariyakulam Sudarsanam, P. (Creator), Diaz-Guerra Aparicio, D. (Creator), Sun, Y. (Creator), Shibuya, T. (Creator), Shusuke, T. (Creator) & Mitsufuji, Y. (Creator), Zenodo, 1 huhtik. 2026
DOI - pysyväislinkki: 10.5281/zenodo.18171004
Tietoaineisto: Dataset
-
STARSS22: Sony-TAu Realistic Spatial Soundscapes 2022 dataset
Politis, A. (Creator), Mitsufuji, Y. (Creator), Ariyakulam Sudarsanam, P. (Creator), Shimada, K. (Creator), Adavanne, S. (Creator), Koyama, Y. (Creator), Krause, D. (Creator), Takahashi, N. (Creator), Takahashi, S. (Creator) & Virtanen, T. (Creator), Zenodo, 31 toukok. 2022
DOI - pysyväislinkki: 10.5281/zenodo.6600531
Tietoaineisto: Dataset
-
AVCaps: An audio-visual dataset with modality-specific captions
Ariyakulam Sudarsanam, P. (Creator), Martin Morato, I. (Creator), Hakala, A. (Creator) & Virtanen, T. (Creator), Zenodo, 20 jouluk. 2024
DOI - pysyväislinkki: 10.5281/zenodo.14536325
Tietoaineisto: Dataset
-
STARSS23: Sony-TAu Realistic Spatial Soundscapes 2023
Politis, A. (Creator), Shimada, K. (Contributor), Ariyakulam Sudarsanam, P. (Contributor), Hakala, A. (Contributor), Takahashi, S. (Contributor), Krause, D. (Contributor), Takahashi, N. (Contributor), Adavanne, S. (Contributor), Koyama, Y. (Contributor), Mitsufuji, Y. (Contributor) & Virtanen, T. (Contributor), Zenodo, 8 maalisk. 2023
DOI - pysyväislinkki: 10.5281/zenodo.7709051
Tietoaineisto: Dataset
Aktiviteetit
- 1 Konferenssiesitelmä
-
Multimodal captions beyond metrics: A linguistic and machine learning analysis of the AVCaps dataset
Ariyakulam Sudarsanam, P. (Speaker), Martin Morato, I. (Speaker), Tuuri, E. (Speaker), Surakka, M. (Speaker), Hirvonen, M. (Speaker) & Virtanen, T. (Speaker)
2 lokak. 2025Aktiviteetti: Konferenssiesitelmä