Bug: Hardcoded path parsing in get_multisession_dataloader ignores ChunkDataset.data_key

While going through dataloaders.py, I noticed that get_multisession_dataloader() uses hardcoded string splitting to derive dataset_name:

 TODO use saved meta dict to find data key#
if "dynamic" in path:
    dataset_name = path.split("dynamic")[1].split("-Video")[0]
elif "_gaze" in path:
    dataset_name = path.split("_gaze")[0].split("datasets/")[1]
else:
    dataset_name = f"session_{i}"

I think it assumes specific directory naming conventions and uses a hardcoded "datasets/" separator that breaks on Windows or non standard folder structures. There's also a TODO comment acknowledging this should use the meta dict instead.
Interestingly, 
get_multisession_concat_dataloader() right below it already solves this correctly by using dataset.data_key (line 169), which pulls from meta.json with proper fallbacks.
The fix would be to remove the if/elif/else block and just use dataset.data_key after creating the ChunkDataset, consistent with how the concat variant already works.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Bug: Hardcoded path parsing in get_multisession_dataloader ignores ChunkDataset.data_key #153

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Bug: Hardcoded path parsing in get_multisession_dataloader ignores ChunkDataset.data_key #153

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions