Big data: Forskelle mellem versioner

Content deleted Content added
m bot: indsæt skabelon autoritetsdata
Big data med lille b i hele artiklen.
Linje 1:
[[File:Viegas-UserActivityonWikipedia.gif|thumb|right|Denne visualisation af redigeringer på [[Wikipedia]] er skabt af [[IBM]]. Med en størrelse på adskillige [[terabyte]]s er Wikipedias tekst og billeder et klassisk eksempel på Bigbig data.]]
'''Big data'''<ref>{{en sprog}} {{cite book |first=Tom |last=White |title=Hadoop: The Definitive Guide |url=http://books.google.com/books?id=Wu_xeGdU4G8C&pg=PA3 |date=10 May 2012 |publisher=O'Reilly Media |isbn=978-1-4493-3877-0 |page=3}}</ref><ref>{{en sprog}} {{cite web |title=MIKE2.0, Big Data Definition |url=http://mike2.openmethodology.org/wiki/Big_Data_Definition}}</ref> er et begreb indenfor [[datalogi]], der bredt dækker over indsamling, opbevaring,<ref>{{en sprog}} {{cite web |author=Kusnetzky, Dan |title=What is "Big Data?" |publisher=ZDNet |url=http://blogs.zdnet.com/virtualization/?p=1708}}</ref> analyse,<ref>{{en sprog}} {{cite web |author=Vance, Ashley |title=Start-Up Goes After Big Data With Hadoop Helper |date=22 April 2010 |work=New York Times Blog |url=http://bits.blogs.nytimes.com/2010/04/22/start-up-goes-after-big-data-with-hadoop-helper/?dbk}}</ref> processering og fortolkning af enorme mængder af [[data]]. Som mange andre [[Informationsteknologi|IT-ord]] har Bigbig data ingen [[Dansk (sprog)|dansk]] oversættelse.
 
Rammerne for Bigbig data har gennem årene rykket sig kraftigt. Man har således bevæget sig fra en opfattelse af [[gigabyte]] data som værende store datamængder, til at man i 2012 snakkede om [[petabyte]] og [[exabyte]] som store mængder.<ref name="Ars Technica">{{en sprog}} {{Cite web|url=http://arstechnica.com/science/2012/04/future-telescope-array-drives-development-of-exabyte-processing/|title=Future telescope array drives development of exabyte processing|date=2012-04-02|accessdate=2012-10-24|author=Francis, Matthew}}</ref><ref name="ReadWriteWeb">{{en sprog}} {{Cite web|url=http://readwrite.com/2012/03/05/big-data|title=The Age of Exabytes: Tools and Approaches for Managing Big Data|accessdate=2012-10-24|publisher=Hewlett-Packard Development Company|year=2010|author=Watters, Audrey|format=Website/Slideshare}}</ref> Tendensen i retning af større datasæt har grundlag i muligheden for at trække supplerende information fra analyse af et enkelt sæt af stor mængde sammenhængende data, i sammenligning med adskilte, mindre sæt med den samme totale mængde data, der giver mulighed for at finde sammenhænge så man kan "spotte [[Trend|forretningstrends]], fastslå [[forskning]]s kvalitet, forebygge [[sygdom]]me, sammenholde [[Jura|juridiske]] citater, bekæmpe [[kriminalitet]] og holde øje med [[trafik]]forhold i realtid."<ref name=BD-HB-R-01>{{en sprog}} {{cite web|title=E-Discovery Special Report: The Rising Tide of Nonlinear Review|url=http://hudsonlegalblog.com/e-discovery/e-discovery-special-report-rising-tide-nonlinear-review.html|publisher=[[Hudson Global]]|accessdate=1 July 2012}} by Cat Casey and Alejandra Perez</ref><ref name=BD-HB-R-02>{{en sprog}} {{cite web|title=What Technology-Assisted Electronic Discovery Teaches Us About The Role Of Humans In Technology&nbsp;— Re-Humanizing Technology-Assisted Review|url=http://www.forbes.com/sites/benkerschberg/2012/01/09/what-technology-assisted-electronic-discovery-teaches-us-about-the-role-of-humans-in-technology/|publisher=[[Forbes]]|accessdate=1 July 2012}}</ref>
 
[[Videnskabsmand|Videnskabsmænd]] møder ofte begrænsninger som følge af store datasæt; sådanne områder kan inkludere [[meteorologi]], [[genetik]],<ref>{{en sprog}} {{cite journal |title=Community cleverness required |journal=Nature |volume=455 |issue=7209 |page=1 |date=4 September 2008 |doi=10.1038/455001a |url=http://www.nature.com/nature/journal/v455/n7209/full/455001a.html}} </ref> komplekse [[Fysik|fysiske]] simulationer<ref>{{en sprog}} {{cite web |title=Sandia sees data management challenges spiral |date=4 August 2009 |work=HPC Projects |url=http://www.hpcprojects.com/news/news_story.php?news_id=922}} </ref> og [[biologi]]sk og [[miljø]]mæssig [[forskning]].<ref>{{en sprog}} {{cite journal |last1=Reichman |first1=O.J. |last2=Jones |first2=M.B. |last3=Schildhauer |first3=M.P. |title=Challenges and Opportunities of Open Data in Ecology |journal=Science |volume=331 |issue=6018 |pages=703–5 |year=2011 |doi=10.1126/science.1197962 }} </ref>
Linje 26:
}}</ref>
 
== Håndtering af Bigbig data ==
Når man arbejder med store mængder af heterogene data (Bigbig data), er det ofte at det traditionelle [[SQL]]-database[[paradigme]] ikke kan løse opgaven. Dels fordi man ikke kan lave en model, der kan rumme alle datas egenskaber, og dels skalerer de ikke til den enorme mængde data. Derfor håndterer man ofte Bigbig data i [[NoSQL]] databaser. Grundlæggende vælger man en type af database som understøtter, analyse af data på en bestemt måde. F.eks. vælger sociale netværk ofte at gemme informationer om hvem der er "venner" med hvem, i såkaldte grafdatabaser. Har man mange semistrukturerede informationer, vælger man ofte en såkaldt dokumentdatabase.
 
== Referencer ==