-
emagine

Utvikler sekvensarkiv

emagine
Norway · Full-time · Not Applicable

Oppdragsbeskrivelse:

FHI skal lage et sekvensarkiv, et datavarehus for egne gensekvenser/genomsekvenser fra pathogener, på FHI som er tilgangsstyrt og søkbart. Arkivet skal kun huse genomsekvenser på prøver generert ved FHI (konsensus sekvenser og/eller filbaner til rådatafiler) og skal ikke inneholde sensitive data.

Det skal være minimalt med duplisering av data som finnes i andre FHI datavarehus, som f.eks. Labware (Laboratorie LIMS systemet). Arkivet skal kunne være søkbart og det skal være nok informasjon tilgjengelig som gjør at relevante gensekvenser kan søkes opp og hentes ut. Det skal også være mulig å løpende legge inn gensekvenser eller informasjoner. Det er viktig at formål for å generere sekvensen er angitt i arkivet, feks som rettslig grunnlag eller REK godkjennelse. Det er behov for en teknisk utvikler for å kunne legge til rette for løsningen. Prosjektgruppen på FHI har klart for seg klart mye av innhold og har forslag til utforming basert på eksempler fra lignende løsninger utenfor FHI som brukes i dag (feks GISAID og ENA).

Teknisk løsning:

  • Vi ser for oss en SQL database med informasjon om sekvensene og som er søkbar, 2) et brukerensesnitt for tilgang, søkemulighet og dataopplasting/nedlasting (batch og enkeltvis opp/nedlasting og oppdatering), og 3) en FTP server (kanskje en kryptert SFTP server) hvor de faktiske datafilene til sekvensene «bor».

SQL- databasen som vi ser for oss er selve arkivløsningen «FHI sekvensarkiv», en søkbar liste over prøver og agens. Denne må ha en HTML?-front-end som kan brukes i Linux/windows som gjør at man enkelte kan få tilgang til de ulike delene av arkivet basert på forutbestemt tilgangsstyring, kobling til FHI konti via ms authenticator. Både for manuell opplasting av enkeltfiler (for det meste Windows) og batch-opplastinger fra Windows- og Linux-miljøer. Det trengs en API for batch opplasting/nedlasting og en html-basert opplasting/nedalstings løsning. Arkivet skal vise til og kunne hente opp genomsekvenser fra FTP serveren. Genomdata er store (ofte :100Mb - 1Gb pr fil). Det kan finnes flere sett med slike fastq-filer tilknyttet samme prøve, og det kan derfor være hensiktsmessig og også lagre en md5-signatur for hver fil i sekvensarkivet. Det må være mulig å søke etter sekvensfiler i arkivet og få lister over tilgjengelige filer utfra gitte kriterier. Disse filene må deretter kunne eksporteres ut fra FTP serveren og til andre deler av FHI-nettverket.

  • Sentralisert metadatalagring (SQL-server): Utvalgte metadata knyttet til genomsekvensering, prøver og kvalitetsdata lagres i en SQL database (FHI sekvensarkiv). Dette gir effektiv og rask tilgang til informasjonen, samtidig som dataene er søkbare og enkelt kan kobles sammen og eventuelt suppleres.
  • Skybasert, sikker fil-lagring: Store sekvensfiler (FASTQ- og FASTA-format, kanskje POD5) lagres i en skytjeneste, (SFTP/FTP server), og SQL-databasen inneholder kun lenken til filene samt deres MD5-sjekksum. Dette sikrer at filene ikke er blitt endret, og gir full integritet, noe som er avgjørende for å kunne stole på dataene for videre bruk. Til sammen muliggjør dette skalerbarhet og forhindrer lagringsproblemer lokalt.
  • Brukergrensesnitt: En brukervennlig webportal gir mikrobiologer og bioinformatikere muligheten til å:
  • Webgrensesnitt for data opplasting og tilgang. Laste opp metadata og filer på en strukturert måte.
  • Spore status på opplastede data.
  • Mulighet for å hente ut data og sekvenser (både som grafisk og CLI løsning) og på sikt automatisk opplasting av utvalgte data til andre databaser feks GISAID og ENA.
  • Både linux og windows tilgang

Absolutte krav:

  • Tilbudte konsulent(er) skal ha erfaring med utvikling med, og integrering mot, Microsoft Azure. Spesifikt tilgangsstyring og integrasjon mot EntraID for autentisering, Azure Key Vault for hemmeligheter og Azure Monitor for metrics og logger.
  • Tilbudte konsulent(er) skal ha minimum 3 års erfaring med standard programmeringsspråk brukt på FHI C# / .NET,
  • Tilbudte konsulent(er) skal ha erfaring med containerteknologi. Inklusive automatisk bygging og oppdatering av container-images.
  • Tilbudte konsulent(er) skal ha grunnleggende erfaring og kompetanse innen CIS og OWASP
  • Tilbudte konsulenter skal kunne beherske norsk og engelsk muntlig og skriftlig.
  • Løsningen som utvikles skal være kompatibel med NHN systemer og kunne overtas og driftes av NHN etter endt prosjekt med god dokumentasjon av systemet. Leverandøren skal ha tett kontakt med NHN underveis i prosessen

Omfang og varighet: 1 konsulent i inntil 100% stilling. Det ventes 100 % under utviklingsfasen og kanskje 60 % under uttestingsfasen. Kunden kan velge å fordele arbeidet på inntil to konsulenter hvis det gir det beste produktet. Det forutsettes at (her av de) tilbudt(e) konsulent(er) er 100 % tilgjengelig(e) i utviklingsperioden, noe lavere tilgjengelighet er akseptabelt mens utprøvingsperioden foregår.

Arbeidssted: Oslo/hjemmekontor/Leverandørens kontorer. En stor del av arbeidet kan utføres på hjemmekontor eller utenfor FHI, men det vil være behov for tett kontakt med prosjektgruppen og NHN underveis i prosessen.

NB Kort søknadsfrist: 24.3

Key Skills

Ranked by relevance

ha server sql linux vault cis c
Login to Apply
Posted
Mar 22, 2025
Type
Full-time
Level
Not Applicable
Location
Oslo
Company
emagine

Industries

IT Services IT Consulting

Categories

Engineering Information Technology

Related Jobs

3 roles aligned with this opportunity

View all jobs
View Job Details
emagine
Related

Full Stack .Net Developer

2026-05-15

Full-time
Not Applicable
Ireland
IT Services
Engineering
View Job Details
HELIONT
Related

.Net Developer

2026-05-29

Full-time
Entry
Italy
IT Services
Engineering
View Job Details
DILS srl
Related

Middle Full Stack Developer

2026-05-22

Full-time
Mid-Senior
Italy
IT Services
Engineering