El Blog

 
 

Calendario

<<   Septiembre 2005  >>
LMMiJVSD
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30   

Últimos comentarios

Categorías

Zoomblog - y el mundo hispano - en el Web Spam Summit

Por RBA. - 17 de Septiembre, 2005, 2:04, Categoría: General

Este próximo miercoles 21 es ya definitivo que asistiré al segundo Web Spam Summit que organiza Technorati y que tendrá lugar en el ya conocido Googleplex (la sede de Google, para los que la palabra les suene rara), y me han pedido que dé una breve presentación del problema del web spam desde el punto de vista de un servicio de blogs en español, o más concretamente, de las diferencias que puede haber entre combatir el web spam para sitios que no están en inglés.

Por tanto, animo a todos los que leais esto que me remitais cualquier cosa que querais que sea comentada, no ya solo durante mi presentación, que calculo que será breve ya que hay otras, sino incluso luego en los debates que tendremos.

Para haceros una idea del evento, Technorati ya ha confirmado que habrá gente de Ask Jeeves (Bloglines), Feedster, Google, Microsoft, Six Appart, Yahoo, WordPress y otros, y salvo que algún otro compatriota se presente sin yo saberlo, es posible que sea la única representación hispana en el evento, y me encantará ser no solo mi propia voz sino la de cualquiera que desee que transmita sus ideas, sugerencias, etc.

Permalink | 15 Comentarios | Referencias (3)
Etiquetas:

Comentarios

Sapristi! | 17 de Septiembre, 2005, 7:37 | (Contacto, Página)
Comentar la creación de wikis que sirvan de mesa de discusión permanente para tratar este tema, en todas sus vertientes.
El papel que cumplen los tracbacks en este momento, y la posibilidad de que están desactivados por defecto y el usuario los active de cara a la galería, si así lo desea (los puede seguir recibiendo pero no que se viesen) de este modo este tipo de spam se reduciría considerablemente y el "ruido" que hace internet se atenuaría.
A si, lo de utilizar un botoncito de previsulizacion en los comentarios en vez de poner directamente el de comentar también le haria la puñeta durante un tiempo a los Spam-Robots.
Otra idea es que, en vez de utilizar un botón para comentar, utilizar un text-box donde introducir el nombre del blog (p.ejem.) y al pulsar enter para que se publique el comentario.
La creación de unas normas anti-spam que establezcan por ejemplo, que para los sistemas de bitácoras web based se utilice la confirmación via mail captcha .... para evitar fake blogs.
Y tenia mas cosas por la cabeza, cuando me vuelva la inpiracion sigo :P

HECTOR ARTURO AZUZ SANCHEZ | 17 de Septiembre, 2005, 18:07 | (Contacto, Página)
FELICITACIONES ROGELIO. SE QUE APROVECHARAS ESA OPORTUNIDAD. MI SUGERENCIA ES: TRATAR DE LOGRAR ACUERDOS QUE FACILITEN LA IDENTIFICACION DE LOS ROBOTS A TRAVES DE UNA CENTRALIZACION DE LOS DATOS DE IDENTIFICACION DE LOS MISMOS Y A TRAVES DE LA CANALIZACION DE ELLOS DE CARA A OFRECER UNAS ESTADISTICAS EN LAS QUE NO SOLO SE SEPA EL QUE UN BLOG FUE INDEXADO POR UN ROBOT, SINO QUE TAMBIEN SE SEPA A QUE BUSCADOR CORRESPONDE ESE ROBOT Y CUANTOS VISITANTES QUE NO SEAN ROBOTS HA TENIDO UN BLOG; TODO LO ANTERIOR ES APLICABLE A LAS PAGINAS WEB EN GENERAL, NO SOLO A LOS BLOGS.

Fernando | 18 de Septiembre, 2005, 20:31 | (Contacto, Página)
Es una pena que sea tan precipitado, porque sería perfecto para un festival de blogs de esos que se han puesto de moda ahora (http://www.proyectoisla.com/mangasverdes/?p=1037).

Pero bueno, otra vez será.

RBA. | 18 de Septiembre, 2005, 21:31 | (Contacto, Página)
Sapristi, son buenas sugerencias, se tendran en cuenta.

Hector, no creo que el tema de los robots sea del todo relevante con este asunto. Puedo asegurarte que los que hacen web spam procuran que sus bots parezcan lo más humanos posibles, cosa que en realidad no es tan complicada.

Fernando, yo me enteré del "summit" el día 15 y solo pude confirmar mi asistencia el 16. De todos modos, aunque no se pueda hacer algo como lo que sugieres, todavía quedan un par de días para remitir sugerencias, etc. No me creo que Sapristi sea la única persona que lee este blog que tenga algo interesante que comentar :-)

swaze | 19 de Septiembre, 2005, 9:52 | (Contacto, Página)
Las ideas de sapristi son geniales, yo añadiria otra mas, dentro de un mismo servidor (por servidor me refiero a zoomblog, blogspot y demas servidores que ofrecen blogs) que desde una misma ip no sep ueda publicar mas de un mensaje cada x tiempo, es decir que tenga que pasar una serie de segundos o incluso un minuto hasta que sep ueda volver a publicar un ocmentario.

Eso no eliminaria el spam, pero lo haria mas lento y costoso, de todas formas pienso que el gran problema del spam es que es indetectable (se podran detectar a robots spam pero no a lso spamer y con hacerlo a mano lo tienen resuelto) por lo que estaria bien, la opcion de "banear" a un usuario para que no pudiera volver a escribir comentarios en el blog.

saludos y dales caña RBA jejejeje

swaze

Carlos | 19 de Septiembre, 2005, 13:43 | (Contacto, Página)
Hay mucho spam y no veo que se hable mucho de el, en webs de anuncios claisificados. Es decir la gente pone anuncios muchas veces del mismo tema y luego cuando buscas algo en buscadores importantes, por ejemplo relojes, en vez de encontrar webs de marcas de relojes, las primeras posiciones estan ocupadas por anuncios de gente o empresas que venden relojes, en muchos casos falsos. Lo mismo pasa con otros productos o servicios. Muchos spamers repiten anuncio diariamente y en todas las webs de anuncios posibles, con lo que el resultado es aprecido alspam de blogs.

HECTOR ARTURO AZUZ SANCHEZ | 19 de Septiembre, 2005, 15:08 | (Contacto, Página)
ROGELIO, PESE A LA BUENA VOLUNTAD DE LAS EMPRESAS RELACIONADAS CON BUSCADORES, TODAVIA NO SE OBTIENEN ESTADISTICAS MAS DEPURADAS RESPECTO A LAS VISITAS A LOS BLOGS DADO QUE DICHOS ROBOTS NO SE IDENTIFICAN (ROBOTS DE BUSQUEDA, ESPERO QUE ESTEMOS HABLANDO DE LO MISMO, JAJAJAJAJA). REITERO TERCAMENTE MI PROPUESTA CASI IMPUESTA JAJAJAJAJA (SOLO BROMEO ROGELIO).

acentillo | 19 de Septiembre, 2005, 15:51 | (Contacto, Página)
Me sumo a las sugerencias que son muy buenas, y añadiría una buena gestión de los servicios de quejas y notificación de spam de los buscadores.

Actualmente la mayoría cae en saco roto, así se podrían evitar bucles infinitos de posicionamiento y spam. Me explico, si alguien tiene un dominio y crea una carpeta con el mismo nombre que tu sitio o denominación indexada por los buscadores y le mete un redireccionamiento a su sitio principal por htaccess o cualquier otro sistema, y lo envía cada dos por tres al sistema de add url de los buscadores, terminas secuestrado en los buscadores durante meses o incluso años en el mejor de los casos.

Es algo que estoy empezando a ver y a sufrir, en mi caso un tipejo montó el sitio h t t p : / / i m i s t e r y . n e t
, puso este sistema y llevó intentando escapar de él desde diciembre en google, yahoo, altavista, y otros buscadores.

Ningún buscador comprueba que la URL que le han remitido por el sistema de add url se corresponde con un sistema web existente y real, caen en la trampa y son redirigidos hacia el sitio que el hijacker o spammer defina, consideran que el sitio se ha trasladado e indexan sitios fantasma, cuyo contenido ni tiene que ver con el término al que se le referencia en el buscador ni existe. Copando así la mayoría de entradas clave para ganar dinero o posición en la red.

Sería muy sencillo que comprobaran si la dirección que les han remitido es un sistema de redirección y comprobaran el contenido al que redirige, sobre todo si se parece en algo al anterior cacheado, o a la mayoría de entradas contenidas e indexadas por el buscador sobre un mismo término. Igual que se hace con el sistema adsense poniendo anuncios de temáticas parecidas.

Sobre lo comentado con los blogs, hay que redefinir el protocolo de trackback y XML-RPC, porque son muy inseguros, se podría mencionar la IP, y algunos parámetros que identificaran a quién realiza el trackback y se validara la misma con el mismo sistema que usa la wikipedia para evitar proxys.

Respecto a lo de pedir un captcha, dificultaría la usabilidad para gente con minusvalías a no ser que se le añadiera voz, al estilo de ATT Natural Voices que generan archivos wav de pocos KB y gran nitidez acústica http://www.naturalvoices.att.com/. Yo piendo que sería mucho mejor generar un simple número aleatorio entre los post ya publicados en el blog, y pedir al usuario que introduzca el título del mismo, o bien extraer algún dato de él, como pueda ser alguna palabra aleatoria contenida en el cuerpo del mismo o bien del propio título, o combinación de ambos, incluso añadiéndole complementariamente una cadena de 4 o 5 dígitos generada con MD5 o cualquier otro sistema criptográfico sobre la ip, user agent, fecha y hora del usuario que realiza la petición, lógicamente todo ello de manera aleatoria para poder validar. Así nos ahorraríamos el envío de un e-mail o varios, que multiplicado por miles de blogs supone un buen ahorro para no saturar más todavía la red y sería imposible de adivinar para robots o usuarios malintencionados.

Un saludillo

Angel Serrano | 20 de Septiembre, 2005, 17:05 | (Contacto, Página)
Me gustaria que hablaras tambien del spam de moda en estos ultimos meses en España : el spam de enlaces de directorios generales de poco contenido y casi siempre duplicado con adsense incrustado.

Te remito los spam reports que he hecho en google tanto en la version inglesa como en la española :


Version inglesa de spam report a xeoweb:
XeoWeb tries to enrich based on putting dirt in the web.
He sell 50 to 400 links in dirty general directories with adsense
and a lot of empty categories with duplicate content for 30 to 200 euros.
You can see the web page with the price : http://www.xeoweb.com/precios.php
You can see the list of directories : www.xeoweb.com/foro/tema-1104.html

He was in 6 categories in DMOZ ( a domain in two categories ) because his domains are in dmoz in a few weeks
when in spain country there a lot of persons who wait during 6 to 12 months to get in dmoz directory.
You can see the sites that he has got in dmoz:
http://search.dmoz.org/cgi-bin/search?search=xeoweb
http://xeoweb.bitacoras.com/
http://www.xeoweb.com/ in two categories
http://www.xeoweb.net/
http://www.xeoweb.com/foro/
http://xeoweb.bitacoras.com/feed/rss2/

Other site of xeoweb is : http://www.xeoweb.biz

Xeoweb tries to modify results in www by getting a lot of
dirty links to his sites and for other people:
You can see two links to his site:
http://www.site-sift.com/372 (anchor text==>Posicionamiento en buscadores)
http://www.designerbanners.com/ (anchor text==>Posicionamiento web)
Posicionamiento web is equual to web positioning
Posicionamiento en buscadores is equal to search engine positioning

Version española de spam report a xeoweb:
XeoWeb intenta enriquecerse a base de ensuciar la web.
El vende de 50 a 400 links en directorios generales de poca calidad con adsense ,muchas categorias vacias y bastante contenido duplicado desde 30 a 200 euros.
Usted puede ver la pagina web con los precios : http://www.xeoweb.com/precios.php
Usted puede ver la lista de los directorios : www.xeoweb.com/foro/tema-1104.html

El esta en 6 categorias en DMOZ ( un dominio en 2 categorias ) porque sus dominios en google estan en unas pocas semanas cuando en España hay un monton de personas que esperan durante 6 o 12 meses para conseguir estar en el directorio de dmoz.
Usted puede ver los sitios que tiene en dmoz:
http://search.dmoz.org/cgi-bin/search?search=xeoweb
http://xeoweb.bitacoras.com/
http://www.xeoweb.com/ in two categories
http://www.xeoweb.net/
http://www.xeoweb.com/foro/
http://xeoweb.bitacoras.com/feed/rss2/

Otro sitio de xeoweb es : http://www.xeoweb.biz

Xeoweb intenta modificar los resultados de la www consiguiendo enlaces de poca calidad a sus sitios y al de otra gente:
Usted puede ver 2 sitios:
http://www.site-sift.com/372 (anchor text==>Posicionamiento en buscadores)
http://www.designerbanners.com/ (anchor text==>Posicionamiento web)

HECTOR ARTURO AZUZ SANCHEZ | 20 de Septiembre, 2005, 18:53 | (Contacto, Página)
GRACIAS POR EL RESPALDO ACENTILLO.

Almuñécar | 2 de Noviembre, 2005, 18:43 | (Contacto, Página)
Pienso que los Spam Report, los bloqueos con la barra de google a determinadas páginas (vease carta abierta a Matt Cutt, en Dark Seo Team)...son herramientas que abren la puerta a aquellos que menos escrupulos tienen es decir a aquellos que les es mas facil denunciar a la competencia que cuidar su posicionamiento.
Que además Google no puede ser juez y parte.
Que dado que las empresas importantes hace años que utilizan técnicas de posicionamiento, estas se ven hoy en dia en algunos sectores alejadas de los primeros resultados y esto empobrece enormemente la calidad de la busqueda.
Hoy es 02 de noviembre y si en google.es buscamos "seguro medico" veremos que en las primeras páginas ni aparecen sanitas ni adeslas ni mafre...¿en esto ha mejorado algo la web?
Cuando un usuario busca seguro medico, lo que quiere es encontrar una empresa que le ofrezca el mejor servicio al mejor precio y le importa un carajo si en su página web hay texto oculto o está vinclulada a webpositer.
Pero vamos que detro de poco habra quien pida protección policial para su blog.

Uno Mas | 26 de Diciembre, 2005, 0:19 | (Contacto, Página)
Angel Serrano, porque no en lugar de 'ensuciar' como tu llamas a otros, trabajas y mejoras de paso tu ingles, que es pesimo, por cierto.

Angel Serrano | 14 de Septiembre, 2006, 11:26 | (Contacto, Página)
Eso que llamas ensuciar lo provoco el señor de xeoweb ya que yo entre en su foro de forma normal y me trato como un despota.

De todas formas no necesito el cariño de "Fran Fernandez" que se puede ir a donde yo le diga.

De todas formas te haré caso y mejoraré mi inglés.

A mí desde luego XeoWeb no me ofrece ningún tipo de seriedad.

juan | 5 de Marzo, 2007, 15:59 | (Contacto, Página)
Y eso? por qué no te ofrece ningun tipo de seriedad? te lo digo por curiosidad, ya que soy de la competencia ;)

diseño web

Fco José | 10 de Octubre, 2008, 13:02 | (Contacto, Página)
Perdonad la intromisión pero...
"decidme de verdad que no estais tomando a DMOZ como referencia de proyecto serio y profesional...'po dios'"

Porque para contar batallas de DMOZ no me necesitais ni a mi ni a nadie conocido.... elegid un foro al azar que hable de SEO y no espereis sino 'sapos y culebras'

?ack

Blog alojado en ZoomBlog.com