DMOZ - DMOZ

DMOZ
"dmoz" i vitt på en grön bakgrund med varje bokstav i en separat ruta
Dmoz - Open Directory Project.PNG
Typ av webbplats
Webbkatalog
Tillgänglig i 90 språk, inklusive engelska
Förälder AOL
URL www.dmoz.org ( Arkiverat 2018-01-19 på Wayback Machine )
Kommersiell Nej
Registrering Frivillig
Användare 90 000
Lanserad 5 juni 1998 ; 23 år sedan ( 1998-06-05 )
Nuvarande status Stängd
Innehållslicens
Creative Commons Attribution 3.0 Unported , Open Directory License

DMOZ (från directory.mozilla.org , ett tidigare domännamn , stiliserat med små bokstäver i logotypen) var en flerspråkig katalog med öppet innehåll med World Wide Web- länkar. Webbplatsen och samhället som behöll det var också känt som Open Directory Project ( ODP ). Det ägdes av AOL (nu en del av Verizon Media ) men konstruerades och underhålls av en grupp frivilliga redaktörer.

DMOZ använde ett hierarkiskt ontologischema för att organisera webbplatsförteckningar. Listor om ett liknande ämne grupperades i kategorier som sedan inkluderade mindre kategorier.

DMOZ stängde den 17 mars 2017 eftersom AOL inte längre ville stödja projektet. Webbplatsen blev en enda målsida den dagen, med länkar till ett statiskt arkiv för DMOZ och till DMOZ diskussionsforum, där planer på att byta märke och starta om katalogen diskuteras.

Från och med september 2017 fanns en icke-redigerbar spegel tillgänglig på dmoztools.net, och det tillkännagavs att medan DMOZ-URL: en inte skulle återkomma, skulle en efterföljande version av katalogen vid namn Curlie tillhandahållas.

Historia

DMOZ grundades i USA som Gnuhoo av Rich Skrenta och Bob Truel 1998 medan de båda arbetade som ingenjörer för Sun Microsystems . Chris Tolles, som arbetade på Sun Microsystems som marknadschef för nätverkssäkerhetsprodukter, undertecknade också 1998 som en av grundarna av Gnuhoo tillsammans med grundarna Bryn Dole och Jeremy Wenokur. Skrenta hade utvecklat TASS , en förfader till tenn , den populära trådade Usenet -nyhetsläsaren för Unix -system. Den ursprungliga kategoristrukturen i Gnuhoo -katalogen baserades löst på strukturen för Usenet -nyhetsgrupper som då existerade.

Gnuhoo -katalogen publicerades den 5 juni 1998. Efter att Richard Stallman och Free Software Foundation protesterade mot användningen av Gnu i namnet ändrades Gnuhoo till NewHoo . Yahoo! motsatte sig sedan användningen av Hoo i namnet, vilket föranledde en föreslagen namnändring till ZURL . Innan NewHoo bytte till ZURL förvärvades Netscape Communications Corporation i oktober 1998 och blev Open Directory Project. Netscape släppte data från Open Directory under Open Directory License . Netscape förvärvades av AOL kort därefter och DMOZ var en av tillgångarna som ingick i förvärvet.

DMOZ -storlek efter datum, 1998 till 2015.

När Netscape tog över förvaltningen hade Open Directory Project cirka 100 000 webbadresser indexerade med bidrag från cirka 4500 redaktörer. Den 5 oktober 1999 nådde antalet URL: er som indexeras av DMOZ en miljon. Enligt en inofficiell uppskattning uppgick URL: erna i DMOZ till 1,6 miljoner i april 2000, vilket överträffade dem i Yahoo! Katalog . DMOZ nådde milstolparna med att indexera två miljoner webbadresser den 14 augusti 2000, tre miljoner listor den 18 november 2001 och fyra miljoner den 3 december 2003. Från och med april 2013 fanns 5 169 995 webbplatser listade i över 1 017 500 kategorier. Den 31 oktober 2015 fanns det 3 996 412 webbplatser listade i 1 026 706 kategorier.

I januari 2006 började DMOZ publicera onlinerapporter för att informera allmänheten om projektets utveckling. Den första rapporten omfattade år 2005. Månadsrapporter utfärdades därefter fram till september 2006. Dessa rapporter gav större insikt i katalogens funktion än den förenklade statistiken på katalogens framsida. Antalet listor och kategorier som anges på förstasidan inkluderade kategorierna "Test" och "Bokmärken", men dessa ingick inte i RDF -dumpningen som erbjuds användare. Det fanns cirka 7330 aktiva redaktörer under augusti 2006. 75 151 redaktörer hade bidragit till katalogen den 31 mars 2007. Från och med april 2013 hade antalet bidragande redaktörer ökat till 97 584.

Systemfel och avbrott i redigering, oktober till december 2006

Den 20 oktober 2006 drabbades DMOZs huvudserver av ett katastrofalt fel som hindrade redaktörer från att arbeta med katalogen fram till den 18 december 2006. Under den perioden var en äldre version av katalogen synlig för allmänheten. Den 13 januari 2007 gjordes åter formulär för webbplatsförslag och uppdateringsuppgifter. Den 26 januari 2007 återupptogs veckovis publicering av RDF -soptippar. För att undvika framtida avbrott, byggde systemet på en redundant konfiguration av två Intel-baserade servrar från och med då.

Webbplatsens gränssnitt fick en uppgradering 2016, märkt "DMOZ 3.0", men AOL tog det offline året efter.

Tävlande och spinoff -projekt

När DMOZ blev mer allmänt känt kom två andra stora webbkataloger redigerade av volontärer och sponsrade av Go.com och Zeal , båda nu nedlagda. Dessa kataloger licensierade inte sitt innehåll för öppen distribution av innehåll .

Konceptet att använda en storskalig gemenskap av redaktörer för att sammanställa onlineinnehåll har framgångsrikt tillämpats på andra typer av projekt. DMOZs redigeringsmodell inspirerade direkt åtminstone tre andra volontärprojekt med öppet innehåll: musiksajten MusicMoz, en restaurangkatalog med öppet innehåll som kallas ChefMoz och en encyklopedi som kallas Open Site . Slutligen, enligt Larry Sanger , var DMOZ en del av inspirationen för Nupedia -projektet, från vilket Wikipedia växte fram.

Logohistorik

Innehåll

Gnuhoo lånade den grundläggande dispositionen för dess första ontologi från Usenet . 1998 sa Rich Skrenta: "Jag tog en lång lista med grupper och redigerade dem för hand i en hierarki." Till exempel representerades ämnet i nyhetsgruppen comp.ai.alife av kategorin Datorer/AI/Artificiellt_Liv. De ursprungliga avdelningarna var för vuxna , konst , företag , datorer , spel , hälsa , hem , nyheter , rekreation , referens , regional , vetenskap , shopping , samhälle , sport och "världen". Även om dessa sexton högsta kategorier har förblivit intakta, har ontologin för kategorier på andra och lägre nivå genomgått en gradvis utveckling; väsentliga förändringar initieras av diskussion bland redaktörer och genomförs sedan när konsensus har uppnåtts.

I juli 1998 blev katalogen flerspråkig med tillägget av kategorin World top-level. Resten av katalogen listar endast engelska språk. I maj 2005 var sjuttiofem språk representerade. Tillväxttakten av de icke-engelska komponenter i katalogen har varit större än den engelska komponenten sedan 2002. Medan den engelska delen av katalogen höll nästan 75% av platserna i 2003 World växte nivån till över 1,5 miljoner platser som av Maj 2005, vilket utgör ungefär en tredjedel av katalogen. Ontologin i icke-engelska kategorier speglar i allmänhet den i den engelska katalogen, även om undantag som speglar språkskillnader är ganska vanliga.

Flera av de högsta kategorierna har unika egenskaper. Den Adult kategorin inte är närvarande på katalog hemsida, men det är fullt tillgänglig i RDF dumpa som DMOZ ger. Medan huvuddelen av katalogen huvudsakligen kategoriseras efter ämne, kategoriseras den regionala kategorin främst efter region. Detta har fått många att se DMOZ som två parallella kataloger: Regionala och Aktuella .

Den 14 november 2000 skapades en särskild katalog inom DMOZ för personer under 18 år. Viktiga faktorer som skiljer detta "Barn och tonåringar" från huvudkatalogen är:

  • striktare riktlinjer som begränsar listan av webbplatser till de som är riktade eller "lämpliga" för personer under 18 år;
  • kategorinamn samt webbplatsbeskrivningar använder ordförråd som är " åldersanpassat ";
  • åldersmärken på varje lista skiljer innehåll som passar barn (12 år och yngre), tonåringar (13 till 15 år) och mogna tonåringar (16 till 18 år);
  • Barn och tonåringar är tillgängligt som en separat RDF -dumpning.
  • redigeringsbehörigheter är sådana att gemenskapen är parallell med DMOZ.

I maj 2005 inkluderade denna del av DMOZ över 32 000 webbplatser.

Sedan början av 2004 har hela sajten använts i UTF-8- kodning. Innan detta var kodningen tidigare ISO 8859-1 för engelska språkkategorier och en språkberoende teckenuppsättning för andra språk. RDF-soptipparna har kodats i UTF-8 sedan början av 2000.

Underhåll

Katalogförteckningar underhålls av redaktörer. Medan vissa redaktörer fokuserar på att lägga till nya listor, fokuserar andra på att behålla de befintliga listorna och vissa gör båda. Detta inkluderar uppgifter som redigering av enskilda listor för att korrigera stavnings- och/eller grammatiska fel, samt övervakning av status för länkade webbplatser. Ytterligare andra går igenom webbplatsinsändningar för att ta bort skräppost och dubbletter.

Robozilla är en sökrobot skriven för att kontrollera status för alla områden som ingår i DMOZ. Periodiskt kommer Robozilla att flagga webbplatser som verkar ha flyttat eller försvunnit och redaktörer följer upp för att kontrollera webbplatserna och vidta åtgärder. Denna process är avgörande för katalogen för att uppnå ett av dess grundläggande mål: att minska länkruttningen i webbkataloger. Kort efter varje körning flyttas de platser som är markerade med fel automatiskt till den ogranskade kön där redaktörer kan undersöka dem när tiden tillåter.

På grund av DMOZ: s popularitet och dess inverkan på sökmotorrankningar (se sidrankning ) har domäner med förlorad registrering som finns listade på DMOZ lockat till domänkapning , ett problem som har åtgärdats genom att regelbundet ta bort utgångna domäner från katalogen.

Medan företagens finansiering och personal för DMOZ har minskat under de senaste åren har volontärer skapat redigeringsverktyg som länkcheckare för att komplettera Robozilla, kategorisökare, stavningskontroller, sökverktyg som direkt siktar en ny RDF -dumpning, bokmärken för att automatisera vissa redigeringsfunktioner, mozilla -baserade tillägg och verktyg som hjälper dig att arbeta genom ogranskade köer.

Licens och krav

DMOZ -data har tidigare gjorts tillgängliga under villkoren i Open Directory License , vilket krävde en specifik DMOZ -tillskrivningstabell på varje webbsida som använder data.

Open Directory -licensen inkluderade också ett krav på att användare av data kontinuerligt kontrollerar DMOZ -webbplatsen för uppdateringar och avbryter användning och distribution av data eller verk som härrör från data när en uppdatering sker. Denna begränsning fick Free Software Foundation att hänvisa till Open Directory License som en icke-fri dokumentationslicens, med hänvisning till att rätten att omfördela en viss version inte är permanent och kravet på att kontrollera om det finns ändringar i licensen.

Under 2011 ändrade DMOZ tyst sin licens till en Creative Commons Attribution -licens, som är en gratis licens (och GPL -kompatibel).

RDF -soptippar

DMOZ-data görs tillgängliga via en RDF-liknande dump som publiceras på en nedladdningsserver, äldre versioner arkiveras också där. Nya versioner genereras vanligtvis varje vecka. En DMOZ -editor har katalogiserat ett antal buggar som påträffas i DMOZ RDF -dumpen, viktigast av allt är att filformatet inte är RDF. Så även om den så kallade RDF-dumpningen idag är giltig XML , är den inte giltig RDF och som sådan måste programvara för att bearbeta DMOZ RDF-dumpen vara speciellt skriven för DMOZ-data.

Innehållsanvändare

DMOZ Data befogenheter kärnkatalogtjänster för många av webbens största sökmotorer och portaler, däribland Netscape Search, AOL Search, och Alexa . Google Directory använde DMOZ -information tills den stängdes i juli 2011.

Andra användningar görs också av DMOZ -data. Till exempel tillkännagav Overture våren 2004 en söktjänst för tredje part som kombinerar Yahoo! Katalogsökresultat med DMOZ -titlar, beskrivningar och kategorimetadata. Sökmotorn Gigablast meddelade den 12 maj 2005 sin sökbara kopia av DMOZ. Tekniken gör det möjligt att söka på webbplatser som listas i specifika kategorier, "i själva verket skapar omedelbart över 500 000 vertikala sökmotorer".

Från och med den 8 september 2006 listade DMOZ 313 engelskspråkiga webbplatser som använder DMOZ-data samt 238 webbplatser på andra språk. Dessa siffror återspeglar dock inte hela bilden av användningen, eftersom de webbplatser som använder DMOZ -data utan att följa villkoren i DMOZ -licensen inte är listade.

Policies och procedurer

DMOZ grundades av Rich Skrenta (avbildad 2009, 42 år).

Det finns begränsningar för vem som kan bli en DMOZ -redaktör. Den primära grindvaktsmekanismen är en redaktörsansökningsprocess där redaktörskandidater visar sina redigeringsförmågor, avslöjar anslutningar som kan utgöra en intressekonflikt och annars ger en känsla av hur den sökande sannolikt kommer att ansluta sig till DMOZ -kulturen och uppdraget. En majoritet av ansökningarna avslås men återansökan är tillåten och uppmuntras ibland. Samma standarder gäller för redaktörer av alla kategorier och underkategorier.

DMOZs redigeringsmodell är hierarkisk . När de blir redaktörer har individer i allmänhet redigeringsbehörighet i endast en liten kategori. När de väl har visat grundläggande redigeringskunskaper i enlighet med redigeringsriktlinjerna, är de välkomna att ansöka om ytterligare redigeringsbehörigheter i antingen en bredare kategori eller en annan kategori i katalogen. Mentorskap mellan redaktörer uppmuntras, och interna forum ger ett verktyg för nya redaktörer att ställa frågor.

DMOZ har sina egna interna forum, vars innehåll endast är avsett för redaktörer att i första hand kommunicera med varandra om redigeringsämnen. Tillgång till forum kräver ett redaktörskonto och redaktörer förväntas hålla innehållet i dessa forum privata.

Med tiden kan seniorredaktörer beviljas ytterligare privilegier som återspeglar deras redigeringserfarenhet och ledarskap inom redigeringsgemenskapen. Det enklaste är att redigera alla behörigheter, vilket gör att en redaktör kan komma åt alla kategorier i katalogen. Meta privilegier tillåter dessutom redaktörer att utföra uppgifter som granskar redaktör program, inställning kategori funktioner och hantering av externa och interna rapporter missbruk. Cateditall -privilegier liknar att redigera alla , men bara för en enda katalogkategori. Likaså CATMOD privilegier liknar meta , men bara för en enda katalog kategori. Catmv -privilegier tillåter redaktörer att göra ändringar i katalogontologi genom att flytta eller byta namn på kategorier. Alla dessa privilegier beviljas av administratörer och personal, vanligtvis efter diskussion med metaredigerare .

I augusti 2004 introducerades en ny nivå av privilegier som kallas admin . Administratörsstatus beviljades ett antal långa metas av personal. Administratörer har förmågan att bevilja andra redaktörer editall+ -rättigheter och godkänna nya policyer som omfattar hela katalogen, befogenheter som tidigare endast varit tillgängliga för rotredaktörer (personal).

Alla DMOZ -redaktörer förväntas följa DMOZs redigeringsriktlinjer. Dessa riktlinjer beskriver grunderna för redigering: vilka typer av webbplatser som kan listas och vilka som inte får; hur webbplatsförteckningar ska betecknas och beskrivas på ett löst konsekvent sätt; konventioner för namngivning och byggande av kategorier; intressekonflikter för redigering av webbplatser som redaktören kan äga eller på annat sätt vara ansluten till; och en uppförandekod inom samhället. Redaktörer som befinner sig ha brutit mot dessa riktlinjer kan kontaktas av personal eller högre redaktörer, få sina redigeringsbehörigheter minskade eller helt förlora sina redigeringsbehörigheter. DMOZ -riktlinjer revideras regelbundet efter diskussion i redaktörsforum.

Kontrovers och kritik

Det har länge förekommit anklagelser om att frivilliga DMOZ -redaktörer ger sina egna webbplatser gynnsam behandling samtidigt som de motverkar deras tävlings goda ansträngningar. Sådana anklagelser framförs av ODP: s personal och metaredaktörer, som har befogenhet att vidta disciplinära åtgärder mot frivilliga redaktörer som misstänks ha ägnat sig åt kränkande redigeringsmetoder. År 2003 introducerade DMOZ ett nytt system för offentlig missbruk som gör det möjligt för allmänheten att rapportera och spåra anklagelser om kränkande redaktörers beteende med hjälp av ett onlineformulär. Hämningslös diskussion om DMOZ: s påstådda brister har blivit vanligare på vanliga diskussionsforum för webbansvariga . Även om webbplatspolicy tyder på att en enskild webbplats endast ska lämnas till en kategori, hade Topix.com, en nyhetsaggregeringsplats som drivs av DMOZ -grundaren Rich Skrenta, i oktober 2007 mer än 17 000 annonser.

Tidigt i DMOZ historia gav dess personal representanter för utvalda företag, till exempel Rolling Stone eller CNN , redigeringsåtkomst för att lista enskilda sidor från deras webbplatser. Länkar till enskilda CNN -artiklar lades till fram till 2004, men togs helt bort från katalogen i januari 2008 på grund av att innehållet var föråldrat och inte ansågs värt ansträngningen att underhålla. Det har inte gjorts några liknande experiment med redigeringspolicyn sedan dess.

Ägande och förvaltning

Skärmdump taget i april 2017 som visar att DMOZ -webbplatsen ska stängas.

Den bakomliggande kontroversen kring DMOZ är dess ägande och förvaltning. Några av de ursprungliga GnuHoo -volontärerna ansåg att de hade blivit lurade att gå med i ett kommersiellt företag. I varierande grad har dessa klagomål fortsatt fram till i dag.

Vid DMOZ: s början var det lite tanke på tanken på hur DMOZ ska hanteras och det fanns inga officiella forum , riktlinjer eller vanliga frågor . I huvudsak började DMOZ som en gratis för alla.

Med tiden blev ODP Editor Forums de facto DMOZ -parlamentet och när en av DMOZs anställda skulle lägga upp ett yttrande i forumet skulle det betraktas som ett officiellt beslut. Ändå började DMOZ -personal ge betrodda seniorredaktörer ytterligare redigeringsprivilegier, inklusive möjligheten att godkänna nya redaktörsapplikationer, vilket så småningom ledde till en stratifierad hierarki av uppgifter och privilegier bland DMOZ -redaktörer, med DMOZs betalda personal som hade det sista ordet om DMOZs policyer och procedurer.

Robert Keating, chef för Touchstone Consulting Group i Washington, DC sedan 2006, har arbetat som AOL: s programchef för DMOZ sedan 2004. Han började arbeta för AOL 1999 som Senior Editor för AOL Search, sedan som Managing Editor, AOL Search, DMOZ , och sedan som Media Ecosystem Manager, AOL Product Marketing.

Förfaranden för borttagning av redigerare

DMOZ: s redaktionsborttagningsprocedurer övervakas av DMOZ: s personal och metaredigerare. Enligt DMOZs officiella redaktionella riktlinjer tas redaktörer bort för missbrukande redigeringsmetoder eller ociviliskt beteende. Diskussioner som kan leda till disciplinära åtgärder mot frivilliga redaktörer äger rum i ett privat forum som endast kan nås av DMOZ: s personal och metaredaktörer. Volontärredaktörer som diskuteras får inte besked om att sådana förfaranden äger rum. Vissa tycker att det här arrangemanget är osmakligt, utan vill istället ha en diskussion som mer liknar en rättegång i det amerikanska rättssystemet.

I artikeln "Redigeringsborttagning förklarad" säger DMOZ -metaredaktören Arlarson att "en stor förvirring om borttagning av redaktörer från DMOZ beror på falska eller vilseledande uttalanden från tidigare redaktörer".

DMOZ: s sekretessriktlinjer förbjuder alla nuvarande DMOZ -redaktörer som kan veta någonting från att diskutera orsakerna till specifika borttagning av redaktörer. En generell förteckning över orsaker finns dock till exempel i riktlinjerna. Tidigare har detta lett till att borttagna DMOZ -redaktörer undrar varför de inte kan logga in på DMOZ för att utföra sitt redigeringsarbete.

Påståenden om att redaktörer tas bort för att kritisera policyn

David F. Prenatt, Jr., tidigare DMOZ -redaktör netesq , och en annan tidigare redaktör som är känd av alias The Cunctator , hävdar båda att de har tagits bort för att de inte håller med personal om ändringar av policyer, särskilt DMOZs upphovsrättspolicyer . Enligt deras påståenden använder personalen ursäkten för civilt beteende som ett sätt att ta bort besvärliga redaktörer.

Blacklisting anklagelser

Senior DMOZ -redaktörer har möjlighet att bifoga "varning" eller "inte lista" anteckningar till enskilda domäner men ingen redaktör har den ensidiga möjligheten att blockera vissa webbplatser från att listas. Webbplatser med dessa anteckningar kan fortfarande vara listade och ibland tas anteckningar bort efter viss diskussion.

Hierarkisk struktur

Kritik mot DMOZs hierarkiska struktur uppstod omkring 2005. Många anser att hierarkiska kataloger är för komplicerade. Med uppkomsten av Web 2.0 började folkonomier dyka upp, och vissa redaktörer föreslog att folkonomier, nätverk och riktade grafer är mer "naturliga" och lättare att hantera än hierarkier.

programvara

Sök

ODPSearch-programvaran är en härledd version av Isearch som är öppen källkod , licensierad enligt Mozilla Public License .

Redaktörsforum

ODP Editor Forums kördes ursprungligen på programvara som var baserad på det patenterade Ultimate Bulletin Board -systemet. I juni 2003 bytte de till phpBB -systemet med öppen källkod . Från och med 2007 drivs dessa forum av en modifierad version av phpBB.

Felspårning

Buggspårningsprogrammet som används av ODP är Bugzilla och webbservern Apache . Squid -webbproxyserver användes också men den togs bort i augusti 2007 när lagringsservrarna omorganiserades. Alla dessa applikationer är öppen källkod.

Gränssnitt

DMOZ -databasen/redigeringsprogramvaran är sluten källa (även om Richard Skrenta i juni 1998 sa att han övervägde att licensera den under GNU General Public License ). Detta har lett till kritik från det tidigare nämnda GNU -projektet, varav många också kritiserade DMOZ -innehållslicensen. Innehållet släpptes senare under en Creative Commons -licens, som är kompatibel med GNU -licensen.

Som sådan har det gjorts vissa ansträngningar för att tillhandahålla alternativ till DMOZ. Dessa alternativ skulle tillåta grupper av likasinnade redaktörer att skapa och underhålla sina egna webbkataloger med öppen källkod/öppet innehåll.

ChefMoz

Chef Moz , en utlöpare av DMOZ var ett öppet innehåll katalog av World Wide Web länkar restauranger. Webbplatsen byggdes och underhålls av en gemenskap av frivilliga redaktörer, och ägs av Netscape .

Kocken Moz, som liknar sin förälder DMOZ, använde ett hierarkiskt ontologiskt schema för att organisera webbplatsförteckningar. Listor om ett liknande ämne grupperades i kategorier, som sedan kan innehålla mindre kategorier.

Den 17 februari 2011 bekräftade DMOZ -administratören "lisagirl" att kocken Moz var död.

Tillväxt

Från början 2000 till november 2009 (när det blev omöjligt för redaktörer att logga in på webbplatsen) hade ChefMoz vuxit till att bli den största globala katalogen med restauranger på internet. Det totala antalet restauranger som indexeras sedan 2000 finns i följande tabell:

ÅR Antal restauranger
2000 48 000
2001 75 000
2002 179 000
2003 208 000
2004 258 000
2005 266 000
2006 275000
2007 315 000
2008 325 000

Se även

Referenser

externa länkar