Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

feat(catalogue): extend Resources table to accomodate description of samples collected next to the data #4681

Draft
wants to merge 9 commits into
base: master
Choose a base branch
from

Conversation

hslh
Copy link
Contributor

@hslh hslh commented Feb 5, 2025

What are the main changes you did

  • see issue

@mswertz mswertz changed the title feat(catalogue): extend Resources table feat(catalogue): extend Resources table to accomodate description of samples collected next to the data Feb 5, 2025
Copy link
Member

@mswertz mswertz left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

paar kleine vraagjes, maar ik denk dat ik antwoord al weet: dit is voor mogelijk maken de directory data op te nemen. Op basis daarvan de titel aangepast, klopt dat?

Wbt de samples en imaging heb ik dan niet snel zorgen, wel als het gaat om de data dat we er snel tegenaan lopen meerdere data beschrijvingen te hebben. Daar zou ik dan nog even kritisch naar willen kijken, of dingen niet gemapped/gemerged kunnen worden naar bestaande coderingen.

data/_models/shared/Resources.csv Show resolved Hide resolved
data/_models/shared/Resources.csv Show resolved Hide resolved
data/_models/shared/Resources.csv Show resolved Hide resolved
hslh added a commit that referenced this pull request Feb 6, 2025
@hslh
Copy link
Contributor Author

hslh commented Feb 6, 2025

paar kleine vraagjes, maar ik denk dat ik antwoord al weet: dit is voor mogelijk maken de directory data op te nemen. Op basis daarvan de titel aangepast, klopt dat?

Wbt de samples en imaging heb ik dan niet snel zorgen, wel als het gaat om de data dat we er snel tegenaan lopen meerdere data beschrijvingen te hebben. Daar zou ik dan nog even kritisch naar willen kijken, of dingen niet gemapped/gemerged kunnen worden naar bestaande coderingen.

Ja, in de titel van het issue had ik het wel duidelijk staan.

Mijn idee is om dit als een soort demo (met data) te hebben en dat we het dan in de groep kunnen bespreken om te zien wat voor bezwaren er zijn.

Copy link
Member

@mswertz mswertz left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

op kleine comments na ziet dit er goed uit. Denk ik wel goed deze kennis keer te delen op data model meet want in RD3 deel data model zit er ook veel sample info en ik denk mooi die met dezelfde coderingen te voorzien.

data/_models/shared/Resource qualities.csv Show resolved Hide resolved
data/_models/shared/Resources.csv Show resolved Hide resolved
data/_models/shared/Resources.csv Show resolved Hide resolved
data/_models/shared/Resources.csv Outdated Show resolved Hide resolved
@@ -86,6 +91,11 @@ Resources,,diagnosis medical event vocabulary other,text,,,,,,,,,"If 'other', wh
Resources,,data dictionary available,bool,,,,,,,,,Are a data dictionary and a data model available?,"DataCatalogueFlat,RWEStaging"
Resources,,disease details,ontology_array,,,CatalogueOntologies,MedDRA,,,,,"If data on a specific disease is collected, which diseases does the data source collect information on","DataCatalogueFlat,EMA,RWEStaging"
Resources,,disease details other,text,,,,,,,,,Specify disease details if not present in MedDRA,EMA
Resources,,biospecimen types,ontology_array,,,CatalogueOntologies,BiospecimenType,,,,,"If the data bank contains biospecimens, what types of specimen","DataCatalogueFlat,CohortsStaging"
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

is biospecimen types niet hetzelfde als material types? Of hebben we die alleen op collection event? In any case graag gelijk houden.

Copy link
Contributor Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Dit is de huidige stand van zaken in de catalogus:

Collection event.sample categories -> CatalogueOntologies.Sample categories (310 entries)
Samplesets.sample types -> CatalogueOntologies.Sample types (5 entries)
Resources.biospecimen collected -> CatalogueOntologies.Biospecimens (0 entries)

in RD3/FAIR Genome/DCAT:
Biosamples.BioSpecimenType -> CatalogueOntologies.BiospecimenType (416 entries)

in Directory:
Collection.materials -> DirectoryOntologies.MaterialTypes (22 entries)

Dan lijkt het me een kwestie van kiezen tussen Sample categories en BiospecimenType . Die twee lijken niet heel compatibel; Sample categories is gebaseerd op MeSH, BiospecimenType op NCIT.

data/_ontologies/Body parts.csv Show resolved Hide resolved
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants