code de recriture avec des classes spécifique

  • Auteur de la discussion Auteur de la discussion papa
  • Date de début Date de début
Nouveau WRInaute
Bon j'y arrive vraiment pas et je rencontre deux PB concret :

Pour aller de (la partie en italique existe mais peut/doit être ignorée)

toutes-les-locations,REGION,Bourgogne,tralala,commentaire%20avec des espaces,VariableFacutative1,1,VariableFacutative2,2.html


à

toutes-les-locations.php?REGION=Bourgogne[&tralala=commentaires%20avec des espaces]&VariableFacutative1=1&VariableFacutative2=2

j'utilise

Code:
RewriteRule ^toutes-les-locations(,.+),([^,]+),([^,&]*)([^,]*)\.html toutes-les-locations$1&$2=$3$4\.html [N] 
RewriteRule ^toutes-les-locations,([^,]+),([^,]*)(.*)\.html toutes-les-locations.php?$1=$2$3 [L]

Qui fonctionne mais je n'arrive pas à simplifier mes classes

et pour réecrire

location-gite-Clevacances,IMMOID,692,a,SOUGERES-en-PUISAYE-dans%20l-Yonne-Bourgogne.html
en
location-gite-Clevacances.php?IMMOID=692

Mon essai est lamentable et fait une erreur 500 et je n'y comprends rien

A l'aide SVP!!!!

PS : je reposte dans un nouveau fil car c'et un sujet différent quoique connex à mon PB de plantage qui a été résolu vos conseils éclairés
 
WRInaute accro
c'est une bonne nouvelle que tu es résolu ton plantage serveur :)

-http://www.site.ext/toutes-les-locations,REGION,Bourgogne,tralala,commentaire%20avec des espaces,VariableFacutative1,1,VariableFacutative2,2.html

Ce genre d'url peut-etre prise pour une tentative de spam dans les moteurs. si l'idée est de donner du poid a la page, l'effet inverse peut se produire. Par exemple, ton flag tu pourrais le nommer "locations" tout simplement... Ne pas faire passer les commentaires car ca ne sert a rien et gonfler une url, comme je l'ai déjà souligné, peut avoir des effets pervers..

Les symboles pour réduire tes classes :
http://www.expreg.com/symbole.php

donc "Bourgogne" pourra etre remplacé par la classe [a-zA-Z], VariableFacutative1 par le classe [0-9] et ainsi de suite..
 
Nouveau WRInaute
Merci,

Alors que je croyais mon pb résolu, un semaine plus tard mon serveur replante encore
je crois que ça vient de l'indexation qui adore les .html contrairement au .php et qui me bouffe tout mon temps processeur quand ils s'y mettent à trois en même temps (Google, voila et slurp)

Je vais donc encore resseré encore mes classes
Mais :
Question 1

Tu ne m'as pas préciser si le code ci dessous doit être placer en debut ou en fin de htaccess
Code:
### EMPECHE LE CODE DE BOUCLER 
RewriteCond %{ENV:REDIRECT_STATUS} 200 
RewriteRule ^.*$ - [L]




Question 2

J'ai trouver ce code pour eviter les crawlers parasites : un avis sur son efficacité ? je l'ai mis dans le htacces de la racine

Code:
# ATTENTION LISTE DES USER_AGENT NON VERIFIEE
# Voir http://www.toulouse-renaissance.net/c_outils.htm
# Version compacte
#
RewriteCond %{HTTP_USER_AGENT} ADSARobot|Anarchie|ASPSeek|Atomz|BackWeb|Bandit|BatchFTP|BlackWidow|Boston\ Project|BravoBrian\ SpiderEngine\ MarcoPolo|capture|ChinaClaw|CICC|Crescent\ Internet\ ToolPak|Custo|cyberalert|Digger|Digimarc|DIIbot|DISCoFinder|Download\ Demon|Download\ Wonder|Downloader|Drip|DSurf15a|EasyDL|efp@gmx\.net|Email\ Extractor|EirGrabber|EmailSiphon|Express\ WebPictures|EyeNetIE|FavOrg|FileHound|FlashGet\ WebWasher|FlickBot|GalaxyBot|GetRight|GetSmart|GetWeb!|gigabaz|GornKer|GrabNet|Grafula|Green\ Research|hloader|HMView|HomePageSearch|httpdown|http\ generic|IBM_Planetwide|Image\ Stripper|Image\ Sucker|imagefetch|InterGET|Internet\ Ninja|InternetLinkAgent|InternetSeer\.com|Iria|Irvine|JBH*Agent|JetCar|JOC|JOC\ Web\ Spider|JustView|Lachesis|LeechFTP|LexiBot|lftp|libwww|Link*Sleuth|LINKS\ ARoMATIZED|LinkWalker|lwp-trivial|Magnet|Mac\ Finder|Mag-Net|Mass\ Downloader|MIDown\ tool|Missigua\ Locator|MMMtoCrawl\/UrlDispatcherLLL|^Mozilla$|MSProxy [OR]
RewriteCond %{HTTP_USER_AGENT} Navroad|NearSite|Net\ Vampire|NetAnts|NetMechanic|NetSpider|NetZIP|NetZip\ Downloader|NetZippy|NPBot|Octopus|Openfind|PageGrabber|Papa\ Foto|PersonaPilot|pcBrowser|PingALink|Pockey|Proxy|psbot|Pump|QRVA|RealDownload|Reaper|Recorder|ReGet|RPT-HTTPClient|SearchExpress|Second\ Street\ Research|Seeker|SiteSnagger|SlySearch|SmartDownload|SpaceBison|SqWorm|Stripper|Sucker|SuperBot|SuperHTTP|Surfbot|Szukacz|tAkeOut|TV33_Mercator|URL_Spider_Pro|Vacuum|VoidEYE|Web\ Downloader|Web\ Image\ Collector|Web\ Sucker|WebAuto|Webclipping|Webdup|WebFetch|WebGo\ IS|WebHook|Webinator|WebLeacher|WebMirror|WebReaper|WebSauger|Website\ eXtractor|Website\ Quester|Webster|WebStripper|WebWhacker|WebZIP|Wget|Widow|Wweb|WWWOFFLE|Xaldon\ WebSpider|x-Tractor|Yandex [OR]
RewriteCond %{HTTP_USER_AGENT} ah-ha|aktuelles|amzn_assoc|ASSORT|ATHENS|attach|attache|autoemailspider|bdfetch|big.brother|bmclient|Bullseye|bumblebee|clipping|Crescent|Deweb|diagem|disco|DTS.Agent|ecollector|fastlwspider|Favorites\ Sweeper|Fetch|FEZhead|fluffy|Generic|Getleft|GetWebPage|Girafabot|go-ahead-got-it|Grabber|Harvest|hhjhj@yahoo|IncyWincy|informant|Ingelin|KWebGet|larbin|likse|LWP|MCspider|Mirror|Mister\ PiX|multithreaddb|nationaldirectory|NetCarta|netprospector|NetResearchServer|NEWT|nicerspro|OpaL|OpenTextSiteCrawler|OrangeBot|PackRat|pavuk|PSurf|puf|PushSite|replacer|RepoMonkey|Robozilla|Rover|Rsync|searchhippo|searchterms\.it|Shai|sitecheck|snagger|Spegla|SpiderBot|SurfWalker|tarspider|Templeton|TrueRobot|UIowaCrawler|UtilMind|vagabondo|vayala|visibilitygap|vspider [NC,OR]
RewriteCond %{HTTP_USER_AGENT} w3mir|web\.by\.mail|Web\ Data\ Extractor|webcollector|webcraft@bea|webdevil|webdownloader|WEBMASTERS|WebMiner|webmole|WebSnake|websucker|webvac|webwalk|webweasel|whizbang|WhosTalking|WISEbot|WUMPUS|XGET [NC,OR]
#
# FIN DE LA LISTE COMPACTE DES USER_AGENT NON VERIFIEE

Merci[/code]
 
WRInaute accro
1° je pense que c'est mieux a la fin. Pas sur.

2° bah les crawlers c'est jamais tres mechants. ce qui peut te mettre ton serveur down ca serait les pompeurs de sites (teleport pro and co). Je te conseil de mettre un script anti aspirateur si tu ne l'a pas deja fait.

Avant de mettre la liste dans ton .htaccess, jete un oeil sur tes stats pour voir qu'elle sont les spiders qui pompent ta BP et peut-etre ne selectionner que ceux la pour ta liste.
 
Discussions similaires
Haut