2007:02 - Karlstads universitet

More documents

Recommendations

Info

element i en sekventiell fil tar n instruktioner[13]. Om man bortser fr˚an den korta tid det tar 2 att öppna önskad fil (uppskattningsvis < 1 millisekund) s˚a kan vi beräkna sökhastigheten för att distribuera informationen i b antal filer 8 genom följande ekvation (b n): n b 2 = n 2 · b (3.15) Om vi sedan jämför detta med hastigheten för sekventiell sökning i en fil s˚a erh˚aller vi följande förh˚allande: n 2 n 2·b = 1 b (3.16) Det tar allts˚a 1/b av antalet instruktioner för att genomföra en sökning jämfört med en sekventiell sökning, eller; Teorem 1. Det g˚ar b g˚anger s˚a fort att söka där informationen är distribuerad i b filer än om den är i en fil. Minne Det innebär en overhead för varje extra fil, som är minst lika med storleken för filnamnet. delar man dessutom upp det i en katalogstruktur s˚a blir det en extra overhead för varje katalog, som är minst lika med storleken för katalognamnet. Det krävs, utöver det redan nämnda, ocks˚a information för att beskriva hela fil- och katalog-strukturen i JAR-paketet. 3.3.5 Resultat V˚ara intentioner är att kunna hämta information snabbt utan att tvingas lägga för mycket overhead för att uppn˚a detta. Den bästa metoden för att erbjuda snabb access till informationen anser vi är genom att distribuera data i ett “stort” antal filer. Hur m˚anga filer som anses vara “stort” beror egentligen p˚a hur mycket information som ska sparas. V˚ara 8 I en sekventiell sökning är b = 1. 28
eräkningar visar att storleken p˚a de distribuerade filerna inte bör överstiga 30 Kb om den sekventiella sökningen, som m˚aste ske, inte ska ta för l˚ang tid (l˚ang tid = mer än 500 ms). Detta leder till att antalet filer, b, beror p˚a storleken s (beräknat i Kb) enligt sambandet: b = s filer (3.17) 30 Vi har en databasfil p˚a c:a s = 3MB = 3072Kb vilket, enligt ekvation 3.17, allts˚a leder till att antalet filer b = 3072/30 ≈ 103. 3.4 Indexera data För att kunna hitta den fil som inneh˚aller det token man söker s˚a krävs att filerna är indexerade p˚a n˚agot sätt. Det finns flera tekniker att indexera data för sökning; Binära sökträd [1, 20, 13], multilevel träd som B-träd och B+träd [6, 22, 13], hash funktioner [13, 1, 6, 22, 20], trie [13, 15, 18] och PATRICIA-träd [13] bara för att nämna n˚agra. Vi är i synnerhet intresserade av att söka p˚a strängar t.ex. förnamn eller efternamn. Detta ställer speciella krav p˚a indexeringen jämfört med indexering av heltal. De tekniker vi har tittat närmare p˚a är trie hashing [15, 18] och simple prefix B-tree [2, 22] vilka är de av litteraturen föredragna indexeringsmetoderna för strängar. För att kunna söka p˚a telefonnummer s˚a m˚aste vi, förutom att söka p˚a strängar, ocks˚a kunna söka p˚a heltal. Vi har valt att göra detta genom att använda ett vanligt binärt sökträd (BST), av den anledningen att det är ett enkelt och mycket snabbt sätt att indexera p˚a. Alternativen hade bl.a. varit att använda en hashfunktion eller t.ex. ett B+träd. 3.4.1 Trie hashing Översikt För att söka p˚a stora mängder av l˚anga alfanumeriska strängar föreslog Litwin en metod kallad trie hashing [15, 18]. Det är en hashstruktur som, i motsats till traditionella hash-algoritmer där data lagras osorterad baserat p˚a algoritmen, lagrar data sorterad och 29
Page 1: Avdelning för datavetenskap Sebast
Page 5: Denna rapport är skriven som en de
Page 8 and 9: Abstract The PhonePages of Sweden i
Page 10 and 11: 3.4.1 Trie hashing . . . . . . . .
Page 12 and 13: Figurer 2.1 Olika typer av ändsyst
Page 14 and 15: Tabeller 3.1 Huvudargument för val
Page 16 and 17: framförallt för existerande syste
Page 18 and 19: det finns tydliga begränsningar ä
Page 20 and 21: Eftersom data ligger centraliserat
Page 22 and 23: standa av enheten. Den ska rymma en
Page 24 and 25: 3 Analys av möjliga lösningar Huv
Page 26 and 27: - Prioritet • För att kunna sök
Page 28 and 29: • Minne, varaktigt: hur mycket pl
Page 30 and 31: 3.2.2 File Connection Optional Pack
Page 32 and 33: Minne - varaktigt Inga extra varakt
Page 34 and 35: Tabell 3.1: Huvudargument för val
Page 36 and 37: typ, kan vara av variabel längd oc
Page 38 and 39: ducerades i ekvation 3.1 s˚a lägg
Page 40 and 41: token i tabellen är x = p . Formle
Page 44 and 45: Tabell 3.2: Ordning för hur eftern
Page 46 and 47: abrahamsson adamsson adenmark adolf
Page 48 and 49: ställs p˚a kommande releaser s˚a
Page 50 and 51: att avgöra hur komponenterna ritas
Page 52 and 53: • Om alla pi är lika, det vill s
Page 54 and 55: oavsett var i meddelandet de förek
Page 56 and 57: BPE inte med i detta projekt. 3.7 S
Page 58 and 59: medföra, dvs. Hur koefficienten R
Page 60 and 61: Figur 3.10: Centrala Göteborg, ska
Page 62 and 63: 4 Design Detta kapitel kommer beskr
Page 64 and 65: Figur 4.2: En Sony-Ericsson W800i m
Page 66 and 67: problem och dess lösningar, inte l
Page 68 and 69: Modell Informerar Uppdaterar Inform
Page 70 and 71: detta. Mönstret har m˚anga använ
Page 72 and 73: endast ska f˚a finnas en instans a
Page 74 and 75: metoden TextInputChoices.showNotify
Page 76 and 77: som lyssnar först implementera Obs
Page 78 and 79: Figur 4.11: UML-klassdiagram över
Page 80 and 81: Innehåller 4.5.2 Databas Har Telef
Page 82 and 83: Figur 4.15: UML-klassdiagram för A
Page 84 and 85: 5 Implementation I detta kapitel ko
Page 86 and 87: 1 p r i v a t e synchronized char g
Page 88 and 89: knapptryckningarna kom tillräcklig
Page 90 and 91: 1 p u b l i c synchronized void run
Page 92 and 93:
skall run endast nollställa medlem
Page 94 and 95:
1 p u b l i c c l a s s Soundex { 2
Page 96 and 97:
till den nuvarande soundex-koden. D
Page 98 and 99:
trädstrukturen. 5.4.1 Traversera t
Page 100 and 101:
1 p r i v a t e void p o s t o r d
Page 102 and 103:
5.4.3 Spara trädstruktur För att
Page 104 and 105:
3. Om nästa tecken är ’2’, s
Page 106 and 107:
stacken. När hela den här process
Page 108 and 109:
Av denna anledning s˚a m˚aste en
Page 110 and 111:
1 p r i v a t e Set i n t e r s e c
Page 112 and 113:
1 p r i v a t e Vector i n t e r s
Page 114 and 115:
har inbyggt stöd för att använda
Page 116 and 117:
Ett problem av allvarligare grad va
Page 118 and 119:
Referenser [1] Alfred V. Aho, John
Page 120 and 121:
2FgetArticle.do%3Flocale%3DSV%26art
Page 122 and 123:
Examensarbete - Mobile Search - Jav
Page 124 and 125:
Abstract LocalDirectory_Requirement
Page 126 and 127:
Document name Security class Page P
Page 128 and 129:
Document name Security class Page P
Page 130 and 131:
LocalDirectory_RequirementSpecifica
Page 132 and 133:
5.3 LAPD SECURITY LocalDirectory_Re
Page 134 and 135:
LocalDirectory_RequirementSpecifica
show all

2007:02 - Karlstads universitet

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?