Big Data

Vad är Big Data?

Big Data är datamängder så stora, snabba eller varierade att traditionella databaser och analysverktyg inte räcker till. För att hantera Big Data krävs distribuerad lagring, parallell beräkning och specialiserade verktyg som Hadoop, Spark, Snowflake eller objektlagring i molnet.

Värdet i Big Data ligger inte i datan i sig, utan i möjligheten att hitta mönster, prognoser och beslutsunderlag som inte syns i mindre datamängder.

De 4 V:na — vad som gör data ”big”

  1. Volume — datamängden i sig (terabyte, petabyte, exabyte).
  2. Velocity — hastigheten den genereras och måste bearbetas (realtid vs batch).
  3. Variety — variationen i format (strukturerad SQL, semistrukturerad JSON, ostrukturerad video).
  4. Veracity — datakvalitet och tillförlitlighet — hur mycket man kan lita på datan.

Vissa modeller utökar med ett femte V — Value — för att betona att Big Data utan affärsnytta inte är en investering värd.

Vanliga användningsområden

  • Realtids­bedrägeridetektion i bank och betalning
  • Prediktivt underhåll av maskiner och fordonsflottor
  • Personaliserade rekommendationer (e-handel, streaming)
  • Riskanalys och kreditbedömning
  • Trafikanalys i smarta städer
  • Klinisk forskning och precisionsmedicin

Hur lagras Big Data?

LagerVerktygAnvändning
Data LakeS3, Hadoop HDFS, Azure Data LakeRåa, ostrukturerade data i stora volymer
Data WarehouseSnowflake, BigQuery, RedshiftStrukturerad data för analys och BI
Data LakehouseDatabricks, IcebergKombinerar lake-flexibilitet med warehouse-frågor
NoSQL-databaserMongoDB, CassandraHöghastighets­transaktioner med flexibelt schema

Big Data och svensk datasuveränitet

Stora datamängder innehåller ofta personuppgifter — direkta eller indirekta. När datasetet blir tillräckligt stort räcker det med några ostrukturerade fält för att identifiera enskilda personer (re-identifiering). Det gör att Big Data blir GDPR-känsligt även när det inte uppenbart är personuppgifter — och valet av lagringsleverantör spelar roll.

Savecore — svensk objektlagring för Big Data

Savecore S3 är vår objektlagring i Sverige, kompatibel med S3-API. Du får skalbar Big Data-lagring under svensk lag, utan transferkostnader vid export och utan att Cloud Act gäller.

Se Savecore S3

Vanliga frågor och svar (FAQ)

Vilka specifika krav ställer Big Data på IT-infrastrukturen?

Big Data kräver en infrastruktur byggd för extrem skalbarhet i både datalagring och beräkningskraft. Det krävs även optimerade lagringslösningar som kan balansera kostnad mot prestanda, samt ett högpresterande nätverk för att kunna flytta och bearbeta enorma datamängder snabbt.

Vad är datalake?

Prestandaproblem i ett affärssystem beror ofta på flaskhalsar i den underliggande infrastrukturen. Det kan handla om överbelastade servrar, långsam datalagring eller nätverksproblem. Savecore är experter på att analysera och åtgärda dessa problem för att återställa och optimera systemets prestanda.

Är molnet alltid det bästa alternativet för Big Data?

Ofta, ja. Det publika molnets ”betala för det du använder”-modell och nästintill oändliga skalbarhet är idealisk för de krävande och ofta varierande arbetsbelastningar som Big Data medför. Savecore hjälper er att designa och hantera en kostnadseffektiv och säker molninfrastruktur för era dataprojekt.