Feedly stal innholdet ditt - her er historien og deres kode

I fjor rullet Feedly ut en kontroversiell ny funksjon - kapring av feedlinks. Her er en fullstendig historie om hvorfor folk er sint, og hvordan en blogger bidro til å rette opp situasjonen.

I fjor rullet Feedly ut en kontroversiell ny funksjon - kapring av feedlinks.  Her er en fullstendig historie om hvorfor folk er sint, og hvordan en blogger bidro til å rette opp situasjonen.
Annonse

I fjor rullet Feedly ut en kontroversiell ny "funksjon" - kapring av matelinker for å stjele trafikk fra millioner av bloggere .

Omdirigering av delte koblinger med Feedly til Feedlys egen visning av artikkelen i stedet for artikkelen selv på det opprinnelige nettstedet, er en bekymring for originale innholdsskapere på mange blogger. Det resulterer ikke bare i tap av trafikk, men er også villedende for de som følger en bestemt blogg.

Her er en fullstendig historie om hvorfor folk er sint, og hvordan en blogger bidro til å rette opp situasjonen. Jeg dykker også inn i kildekoden for å vise deg hvor skittent deres små triks er.

Kreditt på grunn: Digital Reader var den opprinnelige kilden til denne nyheten - jeg bestemte meg for å undersøke litt lenger og se nøyaktig hva de var opp til.

Først, de gode nyheter

Ved skriving har oppførselen blitt noe korrigert slik at forkortede Feedly-koblinger faktisk sendes til opphavsmannens nettsted, men en rask undersøkelse av HTTP-statuskoden Topp 10 nettsteder for feilkoder og feilsøking Topp 10 nettsteder for feilkoder & Feilsøking Les mer viste at omadresseringen ikke ble gjort på det typiske servernivået med en 301- eller 302-omdirigering (200, hvilken Feedly sender, betyr "yep, vi har den siden, hold på"; 404 betyr " ikke funnet "; 301 betyr" permanent omdirigering til en annen nettadresse, mens 302 betyr "midlertidig omadressering") .

Dette betydde at omadresseringen ble utført i JavaScript, så jeg ønsket å vite mer. Ved å bruke en kommandolinjens webside å hente verktøy som kalles krøll, kunne jeg hente kildekoden til en sample Feedly-kobling til Techmeme.com før omadresseringen skjedde (siden CURL vil ikke utføre JavaScript) - og det viste noen overraskende godbiter. Her er hva jeg fant.

(Jeg har lastet opp hele kilden her hvis du vil ta en titt - jeg har bare noen interessante utdrag nedenfor)

Noen mennesker var bekymret for SEO-konsekvensene av å ha sitt innhold stjålet og publisert andre steder. Den gode nyheten er at Feedly korrekt angir rel = "canonical" metakoden for å instruere Google om at alle koblingsverdier skal sendes til det opprinnelige nettstedet. Imidlertid er det umulig å fastslå om dette ble lagt til etter at klager begynte eller var tilstede fra starten.

De er slående annonser

I det som var sannsynligvis et feilaktig forsøk på å duplisere en lesbarhetstype funksjonalitet 6 boksene som vil øke din surfinghastighet og produktivitet 6 Webbrowser som vil øke din websurfinghastighet og produktivitet Bookmarklets er unnvikende små hjelpere som sitter i nettleserens bokmerkerlinje. I motsetning til de vanlige bokmerkene dine, arkiverer de ikke en nettadresse, heller bokmerkere er små java-applets med en klikk-funksjonalitet. Det er hundrevis av ... Les mer, som striper en side ned til kjernefaktorene, Feedly fjernet alle reklame-, sporing- og sosiale deleknapper som kan ha vært innebygd i den opprinnelige materien. Her er den fulle listen over ting som blir fjernet:

 var visualExcludePatterns = [ "feedproxy", "feedburner", "/~", "feeds.wordpress.com", "stats.wordpress.com", "googleadservices.com", "feedads", "tweet-this", "fmpub", "-ads", "_ads", "pheedo", "zemanta", "u.npr.org/iserver", "openx.org", "slashdot-it", "smilies", "/ico-", "commindo-media.de", "creatives.commindo-media", "doubleclick.net", "i.techcrunch", "adview", "/feed.gif", ".ads.", "/avw.php”, "wp-digg-this", "feed-injector", "/plugins/", "tweetmeme.com", "_icon_", "/ad-", "share-buttons", "feedsportal.com", "buysellads", "holstee", "musictapp", "/ad_", "/button/", "donate.png"", "/sponsors/", "googlesyndication.com", "/pagead", "/adx", "assets/feed-fb", "assets/feed-tw", "feedburner.com/~ff", "gstatic.com", "feedsportal.com"]; 

Å ta ut en "donate" -knapp virker spesielt galning, av en eller annen grunn.

De er Hijacking Links

Her kommer vi til det mest seriøse punktet, for ikke bare var Feedly skraping innholdet fra nettstedet ditt, da fjernet de eventuelle originale sosiale knapper og rewriting metadataene. Dette betyr at når noen senere delte elementet, ville de faktisk dele Feedly-koblingen og ikke det opprinnelige innlegget . Alle som klikker på den linken, går direkte til Feedly.

Skjermbilde av skrapet innhold fra TheDigitalReader
Skjermbilde av skrapet innhold fra TheDigitalReader

Så hva, kan du spørre? Når et innlegg går viralt, kan det være til stor nytte for det aktuelle nettstedet - øke sidevisninger og annonseinntekter, og utvide publikum. Feedly stod rett og slett den spesielle fordelen bort fra nettstedet for å utvide sin egen brukerbase. Feedly-koden inkluderte sjekker for mobile enheter som ville lede brukerne til den aktuelle appstore-siden.

 function action( where ) { var actionName = "follow"; var url = "http://feedly.com/#" + encodeURIComponent( "subscription/" + feedInfo.id ); if( /iPhone|iPad/i.test( navigator.userAgent ) ) { actionName = "install"; url = "http://itunes.apple.com/us/app/feedly/id396069556"; } else if( /android/i.test( navigator.userAgent ) ) { actionName = "install"; url = "market://details?id=com.devhd.feedly"; } _gaq.push( [ '_trackEvent', bucket(), actionName + "." + where, feedInfo.id ] ); window.setTimeout( function() { document.location.href = url;}, 20 ); window.event.cancelBubble = true window.event.stopPropagation(); window.event.preventDefault(); } 

Det var ikke "bare å gjøre artikkelen enklere å se" - det var å stjele trafikk, ren og enkel. Det er egentlig ikke kult.

Deres første løsning: En hardkodet ekskluderingsliste

Når Digital Reader først klaget til Feedly, var deres svar å omkode JavaScript for å inkludere en ekskluderingsliste . De la bokstavelig talt en sjekk til hver Feedly-lenke for å se om det var et element fra Den digitale leseren, og i så fall å omgå siden kapringen.

 var siteExcludePatterns = [ "/TheDigitalReader/" ]; function shouldExcludeSite( url ) 

Dette er selvfølgelig en absolutt latterlig måte å gjøre dette på - hvis de planlegger å legge til listen da tiden gikk og flere bloggere klaget?

Nate, fra Digital Reader reagerte:

hvor går du av med krevende at jeg velger bort din kapring? Det er som å si at jeg må spørre noen om å slutte å slå meg i ansiktet lommeboken. Og likevel tror du det er rimelig?

Deres andre løsning: En rask Hack for å omgå all kode

Etter det jeg bare kan anta var overveldende antall klager som fulgte, justerte de kapringen filteret som følger:

 if( kind == "partial" || shouldExcludeSite( "http://www.techmeme.com/131202/p30#a131202p30" ) || true ) { document.body.innerHTML = ""; document.location.href = "http://www.techmeme.com/131202/p30#a131202p30"; } 

"Delvis" refererer til at det skrapede innholdet er en full eller en delvis feed - det er ikke noe poeng i kapringsfeeder som bare publiserer et utdrag. Formentlig begynte denne funksjonen som den eneste sjekken som skjedde da du valgte å sende brukeren til det opprinnelige nettstedet eller ikke. Du kan se den første reparasjonen etter det, som kaller funksjonen for å sjekke om dette nettstedet er på listen over nettsteder som har valgt ut; men så ser vi deres endelige løsning på plass -

 || true. 

Hvis du har noen programmeringserfaring, vil du gjenkjenne den raske hacken som sier "den følgende koden vil alltid bli kjørt", og den brukes vanligvis bare i feilsøking. Hvis noen av disse tre betingelsene er sanne (de to første ikke lenger er av betydning), omdirigerer Feedly brukerne umiddelbart til det opprinnelige nettstedet.

Og det er der det står nå. Så hva har vi lært?

I utgangspunktet gikk Feedly om å skape en slags slanket nedlesingserfaring, men måten de gikk om det - å skrive om linker for å formidle sin egen tjeneste gjennom påfølgende sosiale aksjer var ganske forbannet ekkelt. Dette er ikke det eneste dårlige trekket Feedly har gjort nylig heller - forrige måned begynte de å logge på med Google + -kontoer (etter å ha sett hvor bra Google + -loggingen virker for YouTube-YouTube-kommentarseksjonen, nå ryddet opp, hilsen av Google+ YouTube-kommentarer-delen nå Ryddet opp, Hilsen av Google+ Google har ryddet opp YouTube med et nytt Google+ drevet kommentarsystem. Du vil nå se de mest oppvurderte kommentarene, de fra folk i Google + -kretsene dine og fra eieren av videoen. Les mer, jeg gjett), men det var også raskt tilbake. Leksjonen er - du vil kanskje begynne å finne en alternativ feedreader. Google Leserens slutt er nær: Forbered deg på disse alternative RSS-leserne. Leserens slutt er nær: Forbered deg på disse alternative RSS-leserne. Google Reader er død. I juli slår Internettets fremste RSS-tjeneste for alltid, slik at brukerne kan finne en erstatning på egen hånd. Hvis du leter etter et tilsvarende Google, er dette bare ... Les mer, med mindre du allerede var suckered til å betale $ 99 for en Pro-konto.

In this article