Child pages
  • Test af oprettelse af tabel
Skip to end of metadata
Go to start of metadata

arto.com (kategori 3)

[redigér]

Undersøgelse

DLA 2007-08-03: Siden har en meget stor brugerskare og er pt. et af de vigtigste netfællesskaber i for unge i DK. Siden er også anbefalet af redaktionen. Siden bør høstes selektivt.

1

[redigér]

Login-adgang

DLA 2007-08-03: Vip-login giver adgang til hilsner, debat, billeder og videoer. Bør høstes med login. Har bedt BJA om at teste login.

ADGANG: Brugernavn: Statsbib, Kodeord: bogorm

DLA 2007-12-17: Høstes nu med login

DLA 2008-11-13: Høstning med login fungerer ikke, kontaktet CLO.

1

[redigér]

Indsamlingsprofil

Initialer åååå-md-dd

URL

Frekevens

Dybde

DLA 2007-12-21

http://www.arto.dk/http://www.arto.dk/?/section/forum/
http://www.arto.dk/?/section/blog/
http://www.arto.dk/menu/forum.asp
http://www.arto.dk/section/forum/
http://www.arto.dk/section/blog/
http://www.arto.dk/section/blog/menu.aspx

månedligtdagligt
dagligt
dagligt
dagligt
dagligt
dagligt

2 (forside + 2)2 (forside + 2)
2 (forside + 2)
2 (forside + 2)
2 (forside + 2)
2 (forside + 2)
2 (forside + 2)

DLA 2008-11-24:

http://www.arto.com/http://www.arto.com/section/quiz/
http://www.arto.com/section/idol/
http://www.arto.com/section/club/
http://www.arto.com/section/blog/
http://www.arto.com/section/forum/
http://www.arto.com/section/user/common/board.aspx

månedligtmånedligt
månedligt
månedligt
månedligt
månedligt
månedligt

2 (forside + 2)2 (forside + 2)
2 (forside + 2)
2 (forside + 2)
2 (forside + 2)
2 (forside + 2)
2 (forside + 2)

sas 2010-04-27:

http://www.arto.com/section/user/common/board.aspx

6xdagligt

0 (forside)

sas 2010-04-27:

http://www.arto.com/http://www.arto.com/section/quiz/
http://www.arto.com/section/idol/
http://www.arto.com/section/club/
http://www.arto.com/section/blog/
http://www.arto.com/section/forum/

månedligt

2 (forside + 2)

sas 2010-10-04:

http://www.arto.com/section/user/common/board.aspx

6xdagligt

0 (forside)

sas 2010-10-04:

http://www.arto.com/http://www.arto.com/section/quiz/
http://www.arto.com/section/idol/
http://www.arto.com/section/club/
http://www.arto.com/section/blog/
http://www.arto.com/section/forum/

månedligt

path 2 levels

1

2

3

4

[redigér]

Kommentarer (fx ’er lagt i systemet’, ’høstes med login’ etc.)

DLA 2007-12-10: 10 testhøstninger i perioden aug-dec. Høstninger har testet login, video, rullemenuer, faneblade etc. Med sidste testhøstning (job 194) har BJA sørget for, at vi får hvad vi vil have. Testhøstningerne når dog domænegrænsen 1Gb. NB: Når domænet lægges i Prod-systemet, skal alle defaultseeds fra testhøstningerne med, dog skal defaultsseedsene fra sektionerne ikke med i de daglige høstninger (alle dem der hedder noget med ’section’).Desuden: Når domænet er lagt i systemet, skal Bjarne have besked om at lægge password ind.

DLA 2007-12-10: BJA har delt seedlister op i 3: Defaultseeds : rummer kun forsiden + nogle "dummy"-URL'er der skal være der for at login går godt - skal bruges til den månedlige høstning, SectionURLer : rummer alle sektions-URL'er - skal bruges til den månedlige høstning, QA-seeds : rummer alle manglende ting fundet i TEST-systemet - skal bruges til alle høstninger (månedlig + daglig)Til de daglige skal desuden bruges de 2 URL'er der står i indsamlingsprofilen samt alle de URL'er fra sectionURLer der har med de valgte sektioner at gøre (kig efter sektionsnavnet i URL'en)

LAH 2007-12-14: Lagt i systemet. Sendt mail til BJA om at lægge password i: Kat3_dagligt_2_niveauer + Kat3_månedlig_2_niveauer

LAH 2007-06-13: Kvalitetstjekket. Dagligt 2 niveauer er OK.

DLA 2008-11-13: Høstning med login fungerer ikke, kontaktet CLO.

DLA 2008-11-24: Ny indsamlingsprofil, stadig med login. Startet høstning med arto.com. Bibeholder arto.dk til efter QA.

DLA 2009-01-05: QA ok af arto.com. Har fjernet arto.dk

sas 2010-04-27: rutinetjek. Indsamlingsprofil bibeholdes.

sas 2010-05-17: QA i stikprøver - tilsyneladende ok, også videoklip kommer med. At viewerproxy ikke kan finde alle url'er skyldes formodentlig, at domænegrænsen bliver ramt. Domænegrænse sat op fra 2.000.000.000 til 3.000.000.000 bytes. Ny QA efter 2010-05-27.

sas 2010-06-03: domænegrænsen rammes stadig. Domænegrænse sat op fra 3.000.000.000 til 4.000.000.000 bytes. Ny QA efter 2010-06-27.

sas 2010-06-03: QA i stikprøver: siden vises ikke helt korrekt, oprettet QA seeds. Video: Trailere fungerer, ellers er videos ikke høstet. Domænegrænsen rammes stadig. Domænegrænse sat op fra 4.000.000.000 til 5.000.000.000 bytes. Ny QA efter 2010-08-27.

sas 2010-09-08: ny QA i stikprøver fra job http://kb-prod-adm-001.kb.dk:8080/History/Harveststatus-jobdetails.jsp?jobID=92921. Jobbet rammer stadig domænegrænsen. I det store hele ser siden ok ud og man få et godt indtryk af sidens indhold. Der ligger mange videoer, som bliver høstet (!) og muligvis er skyld i, at domænegrænsen stadig rammes (Ikke alt det ønskede kommer med) Umiddelbart ses ingen crawlertraps. bladrefunktioner (javascript) fungerer ikke. Viewerproxy'ens opsamlede url'erIfølge Crawl log mgl. der ikke ret meget, derfor sat domænegrænsen op (en sidste gang) til 6.000.000.000. Ekstra QA/domænegrænsetjek efter 2010-09-27

sas 2010-09-30: mod alle forventninger rammes domænegrænsen stadig. Testhøstning med path 10 levels med sektionerne http://www.arto.com/section/quiz/ oghttp://www.arto.com/section/idol/ (behøver egentlig kun være 2 levels)

sas 2010-10-04: testhøstning ok - indsamlingsprofil ændret.

sas 2010-10-06: QA i stikprøver: ser umiddelbart ok ud, også crawllog - men rammer domænegrænse. Sat op fra 1,000,000,000 bytes til 2.000.000.000 bytes. Ny tjek om en måned!

Det ser ud til, at man godt kan kopiere en tabel fra vores gamle wiki over - men så kan man ikke redigere tabellen mere

  • No labels