Page 1
© 2014 Amazon.com, Inc. and its affiliates. All rights reserved. May not be copied, modified, or distributed in whole or in part without the express consent of Amazon.com, Inc.
Start Up Showcase
Nicolas Pieuchot, Directeur Technique, Zero-Gachis
Olivier Hervieu, Head of Software, Tinyclues
Thomas Grange, CTO, Botify
Stephan Hadinger, Sr Mgr, Solutions Architecture, AWS
Page 3
Paul-Adrien Menez Christophe Menez Nicolas Pieuchot CEO
02.85.52.21.10
[email protected]
CFO / SALES
02.85.52.21.12
[email protected]
CTO
02.85.52.21.11
[email protected]
Une équipe (ultra) motivée !
Page 4
LUTTER GASPILLAGE
ALIMENTAIRE
contre
le
Page 5
Réduction de
50% des invendus
frais en GMS.
Page 7
GAGNANT - GAGNANT
PARTENARIAT
Page 8
Solution
d’étiquetage
à la volée.
Page 10
Nicolas Pieuchot CTO Co-founder
[email protected]
02.85.52.21.11
Page 12
tinyclues - predictive CRM for marketers
• predictive marketing startup
• created in 2010
• based in Paris
• currently a team of 18 :
• data scientist / mathematicians
• software engineers
• sales / marketing
• we are hiring!
• in 2013, we raised 1,4 M€ with:
Page 13
tinyclues - predictive CRM for marketers
Use case: how to target the accurate audience for a video game?
Target?:
• male?
• < 30 years old?
• student?
• action-movie fan?
Page 14
Target?:
• male?
• < 30 years old?
• student?
• action-movie fan?
tinyclues - predictive CRM for marketers
Use case: how to target the accurate audience for a video game?
Page 15
tinyclues - predictive CRM for marketers
1. you choose a product
1. our platform builds a statistical model
1. you choose how many people you want to target
1. our platform builds a sociological report of your target
1. you export the target
Page 16
tinyclues - predictive CRM for marketers
The optimal Battlefield target:
• at the target’s core:
• Dylan, Jordan, Corentin
• 75018 (Paris), 75012 (Paris)
• 40% are men < 30 years old
• 27% are women
• 28% are > 40 years old
• The majority of men under 30
are not interested!
Page 17
tinyclues - predictive CRM for marketers
The optimal Battlefield target:
Performance Impact
+35% or more
(compared to competing
approaches)
Page 18
tinyclues - predictive CRM for marketers
Page 19
tinyclues - predictive CRM for marketers
Page 20
tinyclues - predictive CRM for marketers
easy to deploy
no IT effort for our clients
user-friendly interface
used daily by marketing teams
substantial impact on client revenue
Page 21
tinyclues - predictive CRM for marketers
Page 22
tinyclues - predictive CRM for marketers On AWS, we love (and use everyday):
• EC2 (ELB, AutoScaling Group, and AMI Generation capability)
• S3
• SQS
• SES
• IAM
• CloudFormation
• DynamoDB
• …and many more
AWS is at the heart of tinyclues’ infrastructure. In 3 years, we cannot blame any
production incident on AWS.
Page 23
What do you really know
about your website ?
@botify / www.botify.com
Page 24
Je suis Thomas Grange
(@mpelmann)
Cofondateur de Botify
Page 25
Mon site
(aspiré par
Botify)
Page 26
Mon site
aspiré par un
moteur de
recherche
Page 27
Vu par Botify
Vu par le moteur
Le meilleur des cas
Page 29
Le moteur ne voit
pas du tout la
même chose !
Page 30
Vu par Botify
Vu par le moteur
Le pire des cas
Page 31
Si le moteur ne peut pas voir mon produit?
Personne ne pourra le rechercher?
Page 32
Si le moteur ne peut pas voir mon produit?
Personne ne pourra l’acheter?
Page 33
Question simple :
“Combien de pages
avez-vous sur votre site ?”
Page 34
Tous nos clients
se sont trompés d’un facteur 10 à 1000 !
Page 35
Quels sont donc les objectifs de Botify ?
Page 36
Botify crawle un site
entièrement
Sont extraits : liens sortants, metadonnées (title, h1, canonicals..),
temps de réponses
Page 37
En chiffres
1 site d’1 million de pages =
200 millions de liens
200 à 500 GB de data
Page 39
Architecture (réseau de liens, profondeur des pages...)
Page 40
Santé (temps de chargement, codes réponses)
Page 41
Qualité sémantique (textes inédits et non dupliqués...)
Page 42
Quels critères justifient
qu’une page ne soit pas
crawlée
Page 43
Quels critères justifient
qu’une page ne soit pas
visitée
Page 44
Quelles sont les pages
qui pointent vers des pages 404 ?
Page 45
Quelles sont les pages
dupliquées entre elles ?
Page 46
Quelles sont les pages
qui ne reçoivent qu’un seul lien entrant ?
Page 47
Interpréter avec le crawler
+ avec les logs serveurs
Page 48
Cas pratique :
Réduisons la profondeur des pages dans la structure
(Profondeur 0 = Homepage)
En vert : pages crawlées par le moteur de recherche
En rouge : pas non crawlées par le moteur de recherche
Page 49
Le taux de crawl passe de 40% à 90% !
Page 50
+50% d’audience SEO en moins de 30 jours !
Page 51
Le crawler est accessible immédiatement sur botify.com
(100K pages offertes pour votre 1er crawl)
Page 53
Une architecture élastique
EC2 + Autoscaling Groups (Selon les volumes de calculs entrants)
Page 54
Des services managés pour le
dataflow
SWF (Simple WorkFlow)
SQS (Simple Queue Service)
Page 55
Des services managés pour le
datastorage
S3
SimpleDB/DynamoDB
Page 56
Plus...
Route53 pour les DNS
Cloudfront pour le display des static
Cloudwatch pour le monitoring...
Page 57
© 2014 Amazon.com, Inc. and its affiliates. All rights reserved. May not be copied, modified, or distributed in whole or in part without the express consent of Amazon.com, Inc.
13 Mai 2014
Merci !
Start Up Showcase
Nicolas Pieuchot, Directeur Technique, Zero-Gachis
Olivier Hervieu, Head of Software, Tinyclues
Thomas Grange, CTO, Botify
Stephan Hadinger, Sr Mgr, Solutions Architecture, AWS