Suite

Pourquoi la requête PostGIS n'utilise-t-elle pas l'index spatial ?


J'ai un problème avec une requête spatiale qui n'utilise pas d'index.

Mon schéma est :

CREATE TABLE geoplanet_place ( woeid entier NON NULL, caractère "nom" variable (300) NON NULL, admin_1 caractère variable (300), coordonnées géométrie NON NULL, bbox géométrie NON NULL, CONTRAINTE geoplanet_place_pkey PRIMARY KEY (woeid), CONTRAINTE force_dims_bbox CHECK (st_ndims (bbox) = 2), CONTRAINTE appliquer_dims_coords VÉRIFIER (st_ndims(coords) = 2), CONTRAINTE appliquer_geotype_bbox VÉRIFIER (geometrytype(bbox) = 'POLYGON'::text OU bbox EST NULL), CONTRAINTE appliquer_geotype_coords VÉRIFIER =(coord (geo)metrytype CHECK POINT'::text OR coords IS NULL), CONTRAINTE force_srid_bbox CHECK (st_srid(bbox) = 4326), CONTRAINTE force_srid_coords CHECK (st_srid(coords) = 4326) ) WITH ( OIDS=FALSE );

Mes index sont :

CREATE INDEX geoplanet_place_bbox_id ON geoplanet_place USING gist (bbox); CRÉER UN INDEX geoplanet_place_coords_id ON geoplanet_place USING gist (coords);

Requête A :

SELECT "lieu_géoplanète".."woeid", "lieu_géoplanète".."nom", "lieu_géoplanète".."admin_1" FROM "lieu_géoplanète" O "lieu_géoplanète".."bbox" && ST_Expand(ST_GeomFromText('POINT (-71.41198699999999963) 41.8238720000000015) 4326), 16093.44) ET ST_distance_sphere("geoplanet_place".."coords", ST_GeomFromText('POINT (-71.4119869999999963 41.8238720000000015)', 4326)) <= 16093.44 ORDER BY "geoplanet_place"."woeid" ASC LIMIT 5;

Exécuter EXPLAIN ANALYZE sur la requête A donne :

Limite (coût=0.00… 56.00 lignes=5 largeur=24) (temps réel=1440,482… 1451.604 lignes=5 boucles=1) -> Index Scan en utilisant geoplanet_place_pkey sur geoplanet_place (coût=0.00… 20018585.21 lignes=1787420 largeur=24) ( temps réel = 1440.477 1451.583 ... rangs = 5 boucles = 1) filtrer: ((bbox && '0103000020E61000000100000005000000CFF6E80D6D92CFC0134548DDCE59CFC0CFF6E80D6D92CFC02BC58EC6A183CF406F13EE95034BCF402BC58EC6A183CF406F13EE95034BCF40134548DDCE59CFC0CFF6E80D6D92CFC0134548DDCE59CFC0' :: géométrie) et (st_distance_sphere (coords, '' :: 0101000020E610000023D8B8FE5DDA51C0890B40A374E94440 géométrie) <= 16093,44 :: double précision)) Durée de fonctionnement totale : 1451.657 ms (4 lignes)

Je suppose que le plan utilise l'index car la requête se termine rapidement, mais il ne mentionne l'index nulle part.


La requête B est la requête A réécrite pour utiliser ST_DWithin(). Cet appel de fonction est censé être équivalent à la clause WHERE de la requête A.
Requête B :

SELECT "lieu_géoplanète".."woeid", "lieu_géoplanète".."nom", "lieu_géoplanète".."admin_1" FROM "lieu_géoplanète" WHERE ST_DWithin("lieu_géoplanète".."bbox", ST_GeomFromText('POINT (-71.411986999999999963 41.8238720000000015) 4326), 16093.44) ORDER BY "geoplanet_place". "woeid" ASC LIMIT 5;

Exécuter EXPLAIN sur la requête B donne :

Limite (coût=1884535.96… 1884535.97 lignes=5 largeur=24) -> Tri (coût=1884535.96… 1884535.98 lignes=9 largeur=24) Clé de tri : woeid -> Seq Scan on geoplanet_place (coût=0.00… 1884535.82 lignes=9 largeur = 24) Filtre: ((bbox && '0103000020E61000000100000005000000CFF6E80D6D92CFC0134548DDCE59CFC0CFF6E80D6D92CFC02BC58EC6A183CF406F13EE95034BCF402BC58EC6A183CF406F13EE95034BCF40134548DDCE59CFC0CFF6E80D6D92CFC0134548DDCE59CFC0' :: géométrie) et ( '0101000020E610000023D8B8FE5DDA51C0890B40A374E94440' :: && géométrie st_expand (bbox, 16093,44 :: double précision)) ET _st_dwithin (bbox, '0101000020E610000023D8B8FE5DDA51C0890B40A374E94440' :: géométrie, 16093,44: :double précision)) (5 ​​lignes)

Je n'ai pas autorisé EXPLAIN ANALYZE sur la requête B à se terminer car cela prenait beaucoup de temps.

J'ai exécuté ANALYZE pour voir si cela aiderait, mais rien n'a changé :

ANALYSER VERBOSE geoplanet_place (bbox, coords);

Des questions:

  1. Pourquoi le résultat de EXPLAIN sur la requête A ne dit-il rien sur les index ?
  2. Pourquoi la requête B aboutit-elle à un plan de requête différent alors qu'elle devrait être équivalente à la requête A ?
  3. Que dois-je faire pour que la requête B soit rapide ?
  4. Y a-t-il un problème avec mes index ? Changer les statistiques sur les colonnes de géométrie changera-t-il quelque chose ?

Liens:

  1. Création d'index pour PostGIS : http://postgis.net/docs/using_postgis_dbmanagement.html#idm2459
  2. ST_DWithin : http://postgis.net/docs/ST_DWithin.html
  3. Statistiques utilisées par le planificateur : http://www.postgresql.org/docs/8.4/interactive/planner-stats.html

Votre première requête utilise un index mais pas celui spatial. Voir l'analyse d'index à l'aide de geoplanet_place_pkey. Il est donc plus efficace pour lui d'utiliser la clé id puisque vous faites un ORDER par colonne et que votre filtre spatial couvre l'ensemble de la table.

L'index spatial n'est pas utilisé car votre ST_Expand est trop grand. Vous avez une géométrie mais c'est en long lat. Les unités d'expansion sont donc en long lat. Mon dieu, je ne peux pas imaginer la taille de 16093,44 degrés. cela couvrirait toute votre table, puis une partie, donc l'index est inutile et Postgres est assez intelligent pour s'en rendre compte.

Si vous envisagez de faire cela, utilisez le type de données géographiques et votre 16093.44 serait en mètres et valide et vous n'auriez pas besoin de cet appel ST_Spheriod.

puisque l'appel de géograpy ST_Dwithin s'occuperait de tout.

par exemple.

CREATE TABLE geoplanet_place ( woeid entier NON NULL, caractère "nom" variable (300) NON NULL, caractère admin_1 variable (300), coordonnées géographie (POINT, 4326) NON NULL, bbox géographie (POLYGON, 4326) NON NULL )

puis au lieu de ST_GeomFromText, utilisez ST_GeogFromText


J'ai eu un problème similaire, mais avec une solution différente : j'avais simplement besoin deANALYSERle tableau en question. Cela faisait suite à une nouvelle restauration de la table sur une nouvelle base de données, de sorte que le planificateur de requêtes n'avait pas de statistiques et ne savait donc pas qu'il devait utiliser l'index et est passé par défaut à une analyse séquentielle.


Pourquoi la requête PostGIS n'utilise-t-elle pas l'index spatial ? - Systèmes d'information géographique

  • comptabilité
  • ajax-framework
  • cadre d'application
  • éditeur audio
  • automatisation
  • Big Data
  • moteur de blog
  • le navigateur
  • outil de construction
  • Gestion de processus
  • cache
  • bibliothèque-graphique
  • serveur de chat
  • couverture de code
  • collaboration
  • colonne-base de données
  • gestion de documents
  • extraction de données
  • base de données
  • commerce électronique
  • Client de messagerie
  • base de données intégrée
  • recherche d'entreprise
  • erp
  • facebook-alternative
  • faq-system
  • la finance
  • forum-logiciel
  • ftp
  • recherche en texte intégral
  • moteur de jeu
  • géocodage
  • git
  • base de données graphique
  • système-d'information-de-santé
  • bureau d'aide
  • analyseur html
  • html en texte
  • Gestion des ressources humaines
  • gestion des identités
  • compression d'image
  • récupération de l'information
  • messagerie instantannée
  • système de détection d'intrusion
  • suivi des problèmes
  • java-framework
  • java-jeux
  • jquery-plugin
  • json
  • jvm
  • gestion des clés
  • key-value-store
  • langue-détection
  • système d'exploitation linux
  • outils-linux
  • log-analyse
  • client de messagerie
  • serveur de courrier
  • liste de diffusion
  • lecteur multimédia
  • Serveur multimédia
  • file d'attente des messages
  • micro-blogging
  • cadre-mobile
  • traitement-langage-naturel
  • la gestion du réseau
  • bibliothèque-réseau
  • réseau neuronal
  • pas de SQL
  • nodejs
  • serment
  • base de données objet
  • ocr
  • suite bureautique
  • shopping en ligne
  • système opérateur
  • orme
  • directeur chargé d'emballage
  • bibliothèque-pdf
  • personnel-finance
  • gestion des photos
  • langage de programmation
  • Serveur proxy
  • qa-outils
  • QR Code
  • question
  • la gestion des dossiers
  • base de données relationnelle
  • outil de rapport
  • outil rrd
  • direction-école
  • capture d'écran
  • moteur de recherche
  • serveur-surveillance
  • Panier
  • skype-alternative
  • bibliothèque-sms
  • réseaux sociaux
  • outil de test
  • extraction de texte
  • texte pour parler
  • billetterie
  • client-twitter
  • ubuntu-fork
  • uml-outil
  • test unitaire
  • url-shortening-service
  • contrôle de version
  • vidéo-cms
  • conférence vidéo
  • lecteur vidéo
  • virtualisation
  • visualisation
  • serveur voip
  • VPN
  • analyses d'audience Internet
  • framework-application-web
  • navigateur web
  • robot d'indexation
  • serveur Web
  • éditeur-wysiwyg
  • analyseur-xml
  • xmpp
  • visionneuse xps
  • Zip *: français
  • zlib

Geokdbush - L'index spatial le plus rapide pour les emplacements géographiques en JavaScript

Une extension géographique pour kdbush, l'index spatial statique le plus rapide pour les points en JavaScript. Il implémente des requêtes rapides de voisins les plus proches pour les emplacements sur Terre, en tenant compte de la courbure de la Terre et de l'enroulement de la ligne de date. Inspiré de sphere-knn, mais utilise un algorithme différent.


Autres fichiers et liens

  • APA
  • Auteur
  • BIBTEX
  • Harvard
  • Standard
  • SIF
  • Vancouver

Résultats de recherche : Contribution à la revue › Article › peer-review

T2 - Un index efficace pour la recherche de documents géographiques

N1 - Informations sur le financement : les travaux de Zhisheng Li ont été menés pendant son séjour en tant qu'étudiant invité avec le groupe de recherche PDA de l'Université d'État de Pennsylvanie. Ken C.K. Les travaux de Lee ont été menés au cours de ses études de doctorat au groupe de recherche PDA de la Pennsylvania State University. Wang-Chien Lee et Ken C.K. Lee ont été soutenus en partie par la National Science Foundation dans le cadre de la subvention no. IIS-0534343 et CNS-0626709. Dik Lun Lee a été soutenu en partie par le Research Grants Council, Hong Kong SAR, Chine, sous GRF 615806 et 615707.

N2 - Étant donné une requête géographique composée de mots-clés de requête et d'un emplacement, un moteur de recherche géographique récupère les documents les plus pertinents textuellement et spatialement pour les mots-clés de la requête et l'emplacement, respectivement, et classe les documents récupérés en fonction de leur texte et les pertinences spatiales pour la requête. L'absence d'un index efficace capable de traiter simultanément les aspects textuels et spatiaux des documents rend les moteurs de recherche géographiques existants inefficaces pour répondre aux requêtes géographiques. Dans cet article, nous proposons un index efficace, appelé IR-tree, qui, associé à un algorithme de recherche de documents top-k, facilite quatre tâches principales dans les recherches de documents, à savoir 1) le filtrage spatial, 2) le filtrage textuel, 3) le calcul de pertinence, et 4) documenter le classement d'une manière entièrement intégrée. De plus, IR-tree permet aux recherches d'adopter différents poids sur la pertinence textuelle et spatiale des documents au moment de l'exécution et s'adapte ainsi à une grande variété d'applications. Un ensemble d'expériences complètes sur un large éventail de scénarios a été menée et les résultats de l'expérience démontrent que l'arbre IR surpasse les approches de pointe pour les recherches de documents géographiques.

AB - Étant donné une requête géographique composée de mots-clés de requête et d'un emplacement, un moteur de recherche géographique récupère les documents les plus pertinents textuellement et spatialement pour les mots-clés de la requête et l'emplacement, respectivement, et classe les documents récupérés en fonction de leur texte commun. et les pertinences spatiales pour la requête. L'absence d'un index efficace capable de traiter simultanément les aspects textuels et spatiaux des documents rend les moteurs de recherche géographiques existants inefficaces pour répondre aux requêtes géographiques. Dans cet article, nous proposons un index efficace, appelé IR-tree, qui, associé à un algorithme de recherche de documents top-k, facilite quatre tâches principales dans les recherches de documents, à savoir 1) le filtrage spatial, 2) le filtrage textuel, 3) le calcul de pertinence, et 4) documenter le classement d'une manière entièrement intégrée. De plus, IR-tree permet aux recherches d'adopter différents poids sur la pertinence textuelle et spatiale des documents au moment de l'exécution et s'adapte ainsi à une grande variété d'applications. Un ensemble d'expériences complètes sur un large éventail de scénarios a été menée et les résultats de l'expérience démontrent que l'arbre IR surpasse les approches de pointe pour les recherches de documents géographiques.


Pourquoi la requête PostGIS n'utilise-t-elle pas l'index spatial ? - Systèmes d'information géographique

C'est un nouveau jour pour la santé publique.

Le Florida Department of Health s'efforce de protéger, de promouvoir et d'améliorer la santé de tous les habitants de la Floride grâce à des efforts intégrés de l'État, du comté et de la communauté.

Entrez un ou plusieurs mots-clés pour effectuer une recherche sur le site Web du Florida Department of Health.
Notez que '*' et '?' les caractères génériques sont pris en charge.

Résultats de recherche pour : valeur des soins dans toutes les catégories

La Floride a soixante-seize jours consécutifs de taux de positivité des nouveaux cas inférieur à 10%

TALLAHASSEE — Le Florida D.

La Floride a quatre-vingt-deux jours consécutifs de taux de positivité des nouveaux cas inférieur à 10%

TALLAHASSEE - Le Florida De.

La Floride a soixante et un jours consécutifs de taux de positivité des nouveaux cas inférieur à 10%

TALLAHASSEE - Le Dép. de Floride.

La Floride a soixante-deux jours consécutifs de taux de positivité des nouveaux cas inférieur à 10%

TALLAHASSEE - Le Dép. de Floride.

La Floride a soixante-trois jours consécutifs de taux de positivité des nouveaux cas inférieur à 10%

TALLAHASSEE — Le Florida D.

La Floride a soixante-quatre jours consécutifs de taux de positivité des nouveaux cas inférieur à 10%

TALLAHASSEE - Le Florida De.

La Floride a soixante-cinq jours consécutifs de taux de positivité des nouveaux cas inférieur à 10%

TALLAHASSEE - Le Florida De.

La Floride a soixante-six jours consécutifs de taux de positivité des nouveaux cas inférieur à 10%

TALLAHASSEE - Le Dép. de Floride.

La Floride a soixante-dix-sept jours consécutifs de taux de positivité des nouveaux cas inférieur à 10%


Détails du rapport

Le rapport d'exploration de la publicité mondiale du système d'information géographique (SIG) offre des informations détaillées sur les principaux fabricants et vendeurs qui travaillent directement sur le marché actuellement et qui ont une grande zone de marché selon le pays et la région et d'autres aspects. Le rapport d'étude de présentation du système d'information géographique mondial (SIG) présente une enquête de haut en bas sur le marché en fonction de sections clés, par exemple, le type d'élément, l'application, les organisations clés et k Lire la suite. . .

Le rapport d'exploration de la publicité mondiale du système d'information géographique (SIG) offre des informations détaillées sur les principaux fabricants et vendeurs qui travaillent directement sur le marché actuellement et qui ont une grande zone de marché selon le pays et la région et d'autres aspects. Le rapport d'étude sur la vitrine du système d'information géographique mondial (SIG) présente une enquête de haut en bas sur le marché en fonction de sections clés, par exemple, le type d'élément, l'application, les organisations clés et les paramètres régionaux clés, les clients finaux et autres.

Le rapport de recherche encourage les lecteurs à comprendre l'importance de la qualité, les lacunes, le cas échéant, et une enquête approfondie pour chaque membre de manière indépendante en donnant les données mondiales d'une grande importance sur le marché. Par conséquent, le rapport de recherche présente les profils d'organisation et traite de l'enquête sur le nombre considérable de fournisseurs qui peuvent aider les clients à mieux choisir les produits et services.

Segments clés du «marché mondial des systèmes d’information géographique (SIG)»

Les principaux acteurs du marché couverts dans le rapport sont :
Autodesk Inc., Bentley Systems Incorporated, Caliper Corporation (PSI Services LLC), Computer Aided Development Corporation Limited (Cadcorp), Environmental Systems Research Institute Inc., General Electric Company, Geosoft Inc. (Seequent Ltd.), Hexagon AB, Maxar Technologies Inc., SuperMap Software Co. Ltd., Topcon Corporation et Trimble Inc.

Sur la base des types, le marché a été segmenté en :
Répartition par composant : MatérielLogicielRépartition des services par fonction : MappingSurveyTelematics and NavigationRépartition des services basés sur la localisation par appareil :DesktopMobile Répartition

Sur la base de l'application, le marché a été segmenté en :
AgricultureUtilitairesMinesConstructionTransportPétrole et gazAutres

En fonction des régions, le marché a été segmenté en :
Amérique du Nord
L'Europe 
Asie
Ligne

Le rapport d'enquête donne l'examen des raisons ou moteurs significatifs qui sont à l'origine du développement annoncé du Système d'Information Géographique (SIG). De plus, le rapport donne quelques raisons clés qui peuvent entraver le développement du marché pendant la période d'estimation. Les clients finaux du marché mondial des systèmes d'information géographique (SIG) peuvent être triés en fonction de la taille de l'entreprise. Le rapport présente les portes ouvertes pour les acteurs du marché mondial des mots clés. Il propose en outre des plans d'action qui peuvent être pris et des conjectures de marché qui seraient nécessaires. Cette étude de marché permet aux producteurs de l'industrie d'avoir des modèles de marché futurs en fonction de divers aspects et d'autres marchés à venir. Les principaux acteurs du marché qui ont un grand marché en ce moment sont principalement basés en Asie-Pacifique et en Afrique du Moyen-Orient.

De plus, l'étude de marché fournit également une analyse approfondie des régions, ce qui est l'un des aspects majeurs de la croissance du marché. En outre, certains des outils tels que l'analyse SWOT et PESTEL sont également l'un des aspects susceptibles d'affecter le « marché mondial des mots clés » pour la période de prévision estimée.
En outre, une étude propose une estimation du développement du marché sur la base de la détermination par différentes divisions et segments et des informations passées et actuelles du marché. Le long de ces lignes, l'enquête sur le rapport peut aider les clients à prendre les décisions vitales pour leur développement dans le secteur du système d'information géographique (SIG). Le rapport couvre en outre les parties et les pratiques de développement du marché ainsi que les difficultés rencontrées par les entreprises émergentes. Le rapport de recherche du marché mondial des systèmes d'information géographique (SIG) fournit les données sur la plupart des investisseurs qui envisagent d'investir maintenant, qui ont une grande valeur marchande et fonctionnent correctement dans l'industrie.

Chapitre un : Aperçu du marché
1.1 Présentation du marché
1.2 Portée de la recherche
1.3 Méthodologie de recherche
1.3.1 Sources primaires
1.3.2 Sources secondaires

Chapitre deux : résumé exécutif

Chapitre trois : Perspectives du marché
3.1 Présentation
3.2 Pilotes
3.3 Contraintes
3.4 Opportunités
3.5 Menaces

Chapitre quatre : Aperçu du type de marché
4.1 Type I
4.2 Type II
4.3 Type III

Chapitre cinq : Présentation de l'application
5.1 Demande I
5.2 Demande II
5.3 Demande III

Chapitre six : Analyse du système d'information géographique (SIG) par régions
6.1 Amérique du Nord
6.2 Amérique du Sud
6.3 Asie et Pacifique
6.4 Europe
6.5 Moyen-Orient et Afrique

Chapitre sept : Analyse des acteurs clés
7.1 Part de marché des ventes du système d’information géographique (SIG) mondial par entreprise
7.2 Part de marché des revenus du système d’information géographique (SIG) mondial par entreprise
7.3 Prix de vente du système d'information géographique (SIG) mondial et marge brute par entreprise
7.7 Base de fabrication du système d'information géographique (SIG) mondial
7.5 Entreprise I
7.6 Entreprise II
7.7 Entreprise III
7.8 Société IV
7.9 Analyse SWOT
7.10 Expansion, fusions et acquisitions

Chapitre Huit : Résultats/Conclusion de la recherche

Chapitre neuf : Paysage concurrentiel
9.1 Aperçu
9.2 Initiatives stratégiques
9.2.1 Fusions & Acquisitions
9.2.2 Lancement de nouveaux produits
9.2.3 Investissements
9.2.4 Extension
9.2.5 Ciblage des clients


Informations sur les produits InetSoft : intégration de l'analyse Web dans une solution d'intelligence d'affaires

Vous cherchez une solution d'intelligence d'affaires qui peut intégrer l'analyse de site Web ? InetSoft propose une plate-forme de BI basée sur le Web qui peut fusionner des sources de données disparates, y compris les journaux de sites Web ou les données d'une API d'analyse Web. Lisez les articles ci-dessous sur la solution BI et analytique d'InetSoft.

Un exemple d'analyse des modèles de prescription de médicaments - Continuons à explorer cet exemple d'analyse des modèles de prescription de médicaments. Plutôt que d'examiner cela par diagnostic ou par procédure, il est vraiment utile pour nous de réfléchir à la provenance réelle de ces références. Quels médecins envoient des patients au Dr Monahan ? Si nous examinons cette analyse de référence sur une fenêtre de 120 jours, nous pouvons commencer à rechercher par code et comprendre qui sont les médecins qui envoient réellement des patients au Dr Chan pour le rapport d'électrocardiogramme. Si j'explore et commence à regarder tous les médecins qui envoient des patients, je vois qu'il y a un total de 1801 médecins qui se réfèrent à ce médecin en particulier. Non seulement je connais le nom du médecin traitant, mais je connais sa spécialité principale, et je sais d'où il opère et combien de procédures il envoie au Dr Chan pour cette recommandation. Il y a peut-être une opportunité pour moi de commencer à travailler avec certains des médecins référents de cette liste pour vraiment les influencer et être vraiment en mesure de définir ma stratégie d'engagement. Je suis enfin en mesure de m'associer au Dr Chan en tant que prescripteur clé de l'inhibiteur de l'ECA, puis également aux médecins référents qui lui envoient des patients.

Exemple d'analyse prédictive dans le secteur des assurances - Pour un instant, je voudrais me concentrer sur un exemple d'analyse prédictive dans le secteur des assurances, dans le processus de réclamation automobile. Ce à quoi nous aimerions réfléchir, c'est à quoi cela ressemble-t-il pour le client et pour le gestionnaire de sinistres ? Toutes ces analyses augmenteront-elles le niveau de paperasserie que les clients devront surmonter ou augmenteront-elles la charge de travail du gestionnaire de réclamations ? Si nous examinons cet exemple ici, j'aimerais que vous rencontriez le client Michael Jones. Michael est un père très occupé de deux jeunes enfants. Il est sorti pour une promenade le dimanche, et il est simplement distrait et conduit la voiture sur le côté de la route, et il a besoin de l'aide de sa compagnie d'assurance. À quoi ressemble le processus pour Michael et pour le gestionnaire de sinistres ? En un mot, c'est l'expérience de Michael. Il appelle sa compagnie d'assurance. Il leur raconte ce qui s'est passé. Sarah est la gestionnaire de sinistres qui est chargée de gérer son dossier. Elle lui pose quelques questions. Sa voiture est réparée et c'est un client satisfait. C'est tout ce que Michael voit, et il est heureux à la fin de la journée. Et Sarah ? Quel est l'impact sur elle ? Eh bien, Sarah prend l'appel de Michael. Elle est invitée par le système à poser certaines questions. Elle dit à Michael où apporter une voiture à réparer, et Sarah est également heureuse parce qu'elle est convaincue qu'elle a traité avec Michael efficacement et correctement. Nous avons un client satisfait et un gestionnaire de sinistres satisfait.

Exemple d'analyse marketing - Le deuxième exemple concernait l'analyse marketing sur le terrain pour un très grand constructeur automobile. Leur grand objectif en tant qu'entreprise était de changer leurs relations avec les concessionnaires. Devenez plus consultatif avec les concessionnaires, plus consultatif en termes de quoi vendre, quels types de promotions fonctionnent sur quels véhicules. En descendant jusqu'au niveau du véhicule, en fait même jusqu'à la version de ces véhicules, y compris les remises sur les pièces de rechange. L'entreprise souhaitait abaisser la responsabilité des pertes et profits au niveau régional et, pour ce faire, l'entreprise devait offrir aux directeurs commerciaux régionaux une bien plus grande visibilité et une bien plus grande capacité à explorer leurs données. Les représentants des ventes et les directeurs peuvent poser rapidement des questions entièrement nouvelles avec une interface qui a cette facilité d'utilisation, et cela leur donne en fait une plus grande capacité à consulter les personnes qui gèrent les concessions elles-mêmes. Nous avons fait la même chose avec un autre client, une entreprise qui vend des semences, de nombreux types de semences. Les graines ont des propriétés différentes et cette entreprise utilise des bancs d'essai dans tout le pays afin d'obtenir de très bonnes données sur le rendement produit par différents types de graines dans différents types de sol et à différentes latitudes.

Exemples d'entreprises utilisant des tableaux de bord analytiques - Par exemple, une entreprise pharmaceutique essaie de mesurer la relation qu'elle entretient avec des leaders d'opinion et des médecins. Ils ont donc un indice d'engagement des leaders d'opinion, ils l'appellent. Ils identifient dans chaque domaine qui sont les grands leaders d'opinion, qui sont des personnes qui écrivent les livres, qui rédigent les articles ou qui ont une influence sur les autres médecins et autres universitaires. Ils ont identifié ces 15 ou 20 personnes les plus importantes dans le monde, puis ils ont mesuré la relation qu'ils entretiennent avec eux. Le plus haut niveau de relation pourrait être un médecin qui ira à des séminaires pour vous et parlera des merveilles de votre produit à d'autres médecins. Vous travaillez ensemble depuis des années et ils ont une relation de confiance totale et amicale. Un autre médecin peut être celui qui a gagné même à vous donner un rendez-vous, et vous ne communiquez toujours que par e-mails et appels téléphoniques, et vous avez donc les débuts d'une relation là-bas, mais peut-être qu'ils ne font pas confiance à votre société pharmaceutique, et ils ont eu de mauvaises relations avec vous avant, et ce serait donc un exemple de quelqu'un avec qui vous essayez d'avoir un premier rendez-vous alors que l'autre serait comme un mariage.

Exploration et analyse - Avec l'exploration et l'analyse, nous naviguons vraiment à travers des ensembles de données historiques. C'est beaucoup plus un type d'analyse descendante où nous voyons les résultats. Et puis nous avons une hypothèse, un modèle mental de ce qui a peut-être causé ce résultat, puis nous allons explorer les données, explorer les hiérarchies à travers les dimensions pour trouver la cause première. Donc, à cet égard, c'est un type de raisonnement très déductif que nous employons dans ce type d'analyse. Mais, généralement, nous utilisons des outils de requête et des outils OLAP pour effectuer ce type d'analyse.

Analyses et prises de décision plus rapides, meilleures et moins chères - D'accord, des analyses et des prises de décision plus rapides, meilleures et moins chères, ce sont les objectifs que je vois très souvent dans de nombreux secteurs verticaux. Les enjeux ici et l'échelle ici semblent être beaucoup plus importants. Donc, en parlant d'échelle, vous avez une solution analytique de quatrième génération. Parlez-nous un peu de cela à haut niveau avant d'approfondir un peu les exigences technologiques. Qu'avez-vous développé pour aider à résoudre ces problèmes d'échelle ? Jim : Ainsi, notre plate-forme exploite vraiment la technologie de pipeline de données volumineuses qui la rend accessible aux utilisateurs dans un environnement immersif très interactif et très transparent, leur permettant de se concentrer sur des éléments de données. Et les outils d'analyse leur permettent de prendre des décisions très rapidement et avec une très grande confiance en la qualité que les données vont vraiment aider à prendre une décision de haute qualité. Nous rassemblons donc de grandes quantités de réclamations et d'autres sources de données, et nous les fusionnons dans un très grand ensemble de données, et nous exécutons de nombreuses analyses d'apprentissage automatique en plus de cela et fournissons une variété de visualisations et de constructions de navigation pour eux. Nous leur permettons de voir à quoi ressemble le fournisseur en termes de combien d'argent ils ont facturé, quels types d'activités ont-ils fait, quelles relations ils ont avec d'autres fournisseurs ou d'autres institutions et de vraiment faire surface de manière très visuelle l'interconnectivité qu'ils avaient dans un réseau ou un plan de soins de santé.

Cinq conseils sur l'utilité de l'analyse et des données pour les propriétaires de commerce électronique - Aux premiers jours du commerce électronique, les premiers détaillants ont dû relever le défi de convaincre les clients de leur faire confiance. Donner des numéros de carte de crédit et des informations personnelles en ligne était une chose à laquelle beaucoup n'avaient pas vraiment confiance, donc Amazon et d'autres détaillants ont dû faire un excellent travail pour amener le public à faire confiance à cette nouvelle façon de payer et d'acheter. Alors que les clients sont devenus très à l'aise avec les achats en ligne, l'industrie du commerce électronique a proliféré, avec des ventes au détail mondiales atteignant 3,53 billions de dollars en 2019. Aujourd'hui, les détaillants en ligne doivent faire face à un autre problème profond : la diversité du choix des clients. Bien que cela ne semble pas du tout un problème, donner trop de choix et trop peu d'assistance et de conseils peut : facilement embrouiller les clients et les faire quitter le site les convaincre de reporter l'achat rechercher un produit sur le site d'un concurrent visiter une brique et magasin de mortier à la place.

Quatre types d'analystes - D'accord, alors rencontrons vos analystes. Il existe quatre types d'analystes, et ils ont des étiquettes : &ldquoSuper User&rdquo, &ldquoBusiness Analyst&rdquo, &ldquoAnalytical Modeler&rdquo et &ldquoBusiness Manager.&rdquo Super User, c'est un homme d'affaires dans les ventes, le marketing ou la finance qui s'est tourné vers la technologie , constate qu'il aime utiliser Excel ou les outils de BI, qu'il aime créer des rapports, retrousser ses manches et se plonger dans les données. Et au fil du temps, il est devenu la personne de référence pour tout le monde dans le département pour créer des rapports ad hoc ou des vues ad hoc d'informations. La création et la conception de rapports ne font peut-être pas partie de sa description de poste, mais c'est quelque chose pour lequel il s'est taillé une réputation. Vient ensuite le &ldquoBusiness Analyst&rdquo qui a été embauché pour analyser les données au jour le jour. Elle a probablement un MBA, probablement de très bonnes compétences Excel, des compétences Access, peut connaître un peu SAS, SPSS. Elle a probablement un titre d'analyste financier, ou d'analyste marketing, ou d'analyste des ventes et des opérations, et joue de nombreux rôles différents au sein de l'organisation.

Réduction de la fraude dans le commerce électronique avec de meilleures analyses - Les analyses prédictives et les mégadonnées sont deux moyens par lesquels les vendeurs de commerce électronique peuvent identifier la fraude, qui devient un problème urgent. Selon le Global Fraud Report 2018, près des trois quarts des détaillants en ligne (72 %) conviennent que la fraude dans le commerce électronique est une préoccupation croissante de plus, 63 % d'entre eux « ont subi autant ou plus de pertes de fraude au cours des 12 derniers mois ». l'arrivée des outils d'analyse de données, les vendeurs de commerce électronique utilisent un échantillon de données client pour l'analyse des fraudes. Cela signifie dépenser beaucoup de temps et d'argent pour étudier l'ensemble de l'échantillon, car l'analyse devrait être manuelle. Maintenant que les systèmes d'analyse des mégadonnées sont disponibles, les détaillants peuvent analyser toutes les données pour la fraude beaucoup plus rapidement. Une façon de lutter contre la fraude dans le commerce électronique avec l'analyse de données consiste à utiliser l'analyse prédictive. Voici les étapes de ce processus : Préparez la base de données des commandes en ligne de votre magasin. Il s'agit de définir un délai pour les commandes. Définir les types de transactions à inclure dans la base de données. Étant donné que la fraude dans le commerce électronique ne se produit qu'avec les cartes de crédit, excluez les commandes pour lesquelles la création d'une rétrofacturation est impossible Identifiez les modèles de commandes frauduleuses pour différencier les bonnes et les mauvaises transactions Modélisez les données pour apprendre à l'algorithme à définir les commandes suspectes en fonction des modèles. C'est là que les professionnels et/ou les outils de l'intelligence des données effectuent des approches telles que les algorithmes d'apprentissage en profondeur. Implémentez le modèle Ajoutez de nouveaux modèles de fraude à l'algorithme. De ce fait, il serait possible de réduire le nombre de commandes frauduleuses en les refusant et en interdisant aux fraudeurs d'effectuer des achats.

Logiciel d'analyse gratuit - InetSoft fournit aux utilisateurs un outil de visualisation gratuit, Visualize Free. Basé sur le tableau de bord commercial avancé et le logiciel de visualisation, ce logiciel offre une solution Web qui permet aux gestionnaires d'explorer de manière interactive des ensembles de données complexes et volumineux et de les représenter à l'aide de graphiques et de tableaux visuellement attrayants. Visualize Free propose divers composants analytiques entièrement personnalisables pour répondre à toutes les exigences de visualisation de l'entreprise. Des ensembles de données sont modifiables en différentes vues graphiques permettant une analyse multidimensionnelle et permettant aux gestionnaires d'observer des tendances de croissance ou des aberrations spécifiques.

Tableau de bord analytique de la cartographie géographique - Le tableau de bord analytique de la cartographie géographique ci-dessous montre le type d'outil que de nombreux spécialistes du marketing ou organisations peuvent utiliser pour effectuer des recherches approfondies sur différentes données démographiques dans le district de New York. Tableau de bord analytique interactif basé sur le Web, le graphique ci-dessous constitue une solution facile à consulter et à manœuvrer pour les organisations de nature variée. Le tableau de bord ci-dessous présente la richesse des visuels et des options de filtrage, qui s'adressent fortement à l'utilisateur et à son interaction avec le logiciel. Simple à utiliser, le tableau ci-dessous permet aux utilisateurs de filtrer et de trier par les différents arrondissements de New York et par catégorie de type de groupes et de dimensions de la population. D'emblée, les résultats sont joliment présentés sur la carte et plus précisément, dans le graphique à barres. Ce type de données et de niveau d'interaction est très efficace et efficient pour les chercheurs de marché ou les organisations qui cherchent à recueillir des données sur différentes données démographiques. Puissante dans tous les sens, la solution de business intelligence d'InetSoft a fourni aux organisations des outils de la plus haute qualité pour les tableaux de bord, les rapports et le mashup de données afin d'améliorer les opérations et les objectifs commerciaux.

L'analyse géospatiale prend son envol - L'analyse géospatiale a mis un certain temps à démarrer. Il a décollé ces dernières années. Quelles sont les tendances qui conduisent à cet intérêt ? Il y a quelques raisons non techniques. Tout doit être quelque part. Les technologies de l'information rattrapent leur retard. Nous savons aussi que la première loi de Toffler stipule que tout est lié, mais que les choses voisines le sont. Donc, si vous regardez le fait que les choses physiques doivent avoir un emplacement et que les choses sont liées, elles sont simplement plus liées lorsqu'elles sont proches. C'est vraiment très important pour un certain nombre de raisons commerciales. À l'intérieur du processus métier, comment nous gérons ces relations, ces flux de matériaux ou d'informations d'un point à un autre, voilà à quoi sert la technologie géospatiale. À l'intérieur d'une base de données hautes performances, il existe un ensemble de capacités conformes aux normes pour les données géospatiales. Il s'agit d'une implémentation de niveau entreprise telle qu'elle s'intègre dans tout ce que fait une entreprise. C'est un problème lorsque de nombreuses implémentations de capacités géospatiales se situent en dehors du processus principal de l'entreprise, presque comme si elles étaient à côté.

Applications d'analyse géospatiale - Je vais maintenant commencer par donner quelques exemples de la façon dont les clients utilisent l'analyse géospatiale. C'est très excitant, en particulier dans le secteur de la finance, des assurances et des soins de santé, qui est une grande industrie de l'intelligence d'affaires. Dans ces industries, la technologie est appliquée de diverses manières. Cela va au cœur de l'industrie de l'assurance, par exemple, où les questions de géographie se posent depuis toujours notamment dans le domaine de l'immobilier et de l'automobile. Mais auparavant, les actuaires étaient contraints d'utiliser des données postales pour effectuer ce genre de comparaisons géographiques. Ils essaieraient donc de déterminer si une zone de code postal était proche du rivage, de la côte. Cela pourrait être plus dangereux pour les ouragans venant à terre que les codes postaux plus anciens, et cela a nécessairement toujours été le cas. Et maintenant, avec l'analyse spatiale et l'analyse géospatiale, nous pouvons rendre ce type d'analyse beaucoup plus précis pour les actuaires.

Bon fournisseur de tableaux de bord analytiques - Êtes-vous à la recherche d'un bon fournisseur de tableaux de bord analytiques ? Depuis 1996, InetSoft crée des logiciels de BI faciles à déployer et à utiliser. Créez rapidement des tableaux de bord et des analyses visuelles orientés libre-service. Visionnez une démo de 3 minutes et téléchargez une version gratuite.

Bons exemples de logiciels d'analyse - Vous recherchez les meilleurs exemples de logiciels d'analyse ? InetSoft fournit des exemples de son logiciel d'analyse de tableau de bord très apprécié et facile à utiliser.

Bonne analyse client - L'analyse client aide à transformer vos données en quelque chose d'utile dans les affaires quotidiennes. Une bonne analyse client devient un outil marketing puissant utilisé pour surmonter les obstacles et les transformer en points de vue efficaces. Les entreprises accumulent des données au fur et à mesure qu'elles exploitent les informations sur les clients, les chiffres de vente, les salaires des employés, tous deviennent finalement des chiffres dans une feuille de calcul. Sans une bonne analyse client, cependant, une entreprise ne peut pas vraiment convertir ces informations en connaissances.

Good Business Analyst Consultants - Voici un commentaire. Si je pense à de bons consultants en business analyst ou à ceux qui ont été externalisés, ils apportent peut-être leur expérience et leur expertise à un client, ce qui serait bénéfique pour le client à l'avenir. Je suis d'accord. Je pense que tu as raison. Je pense qu'ils apportent un niveau différent d'objectivité. Je veux dire qu'il n'y a rien de tel qu'une paire d'yeux extérieurs. Un praticien de l'analyse commerciale qui est déployé dans l'environnement client tout le temps, je pense qu'ils apprécient le plus le fait que j'arrive avec un regard neuf et que je regarde les choses avec presque un certain sens de la naïveté . Je le regarde avec un regard neuf. Donc, dans une certaine mesure, il y a une tonne de valeur. Je suis d'accord avec toi. Le cycle de vie du développement de solutions est-il une nouvelle norme dans le monde de la BA ? Je ne le pense pas. C'est une terminologie qui existe depuis plus de 100 ans. Mon Dieu, je suis dans le métier depuis 22 ans, et je connais des gens qui le sont depuis plus longtemps. Le cycle de vie du développement de solutions existe depuis très, très, très longtemps.

Bon outil d'analyse informatique - Avec un bon outil d'analyse informatique, vous pouvez explorer en détail. Vous pouvez faire toutes sortes de choses, mais la chose importante est, #1, de l'examiner du point de vue commercial, en termes de vraiment comment vous fournissez ce service, parce que c'est la raison pour laquelle vous existez dans un sens. Et puis, quelle est l'histoire de le faire, et comment vous allez le faire à l'avenir, et ensuite, cela devient un véhicule de conversation entre l'entreprise et l'informatique et les personnes chargées de l'entreposage de données pour comprendre où vous allez et pour comprendre vos choix. Nous pouvons le faire de cette façon ou de cette façon, et voici l'implication des coûts. Nous pouvons examiner tous ces détails et déterminer quelle est la meilleure façon d'aller de l'avant. Réfléchissez à l'impact que cela aurait sur la relation entre l'informatique et les entreprises. Revenir à changer la culture entre eux parce qu'au début, cela&rsquo &ldquoOh, mon Dieu, c'est cassé, nous allons le réparer dès que nous le pourrons.&rdquo Cela a tendance à ne pas être une bonne relation avec le côté commercial parce que le côté commercial a tendance à regarder l'informatique, &ldquoLe système est en panne, ou il&rsquo pendant une journée.&rdquo Alors que lorsque vous les armez de ce type d'informations, ils deviennent proactifs, et maintenant, ils ont une conversation d'affaires avec l'autre côté de la entreprise en disant : « Regardez, voici ce que nous faisons, voici comment nous vous servons, ce qui est formidable, mais voici ce que nous devons planifier pour cela. » C'est une culture et une conversation complètement différentes.


4. DISCUSSION

Une détermination fiable des organismes est une condition préalable nécessaire pour explorer leur occurrence spatiale et temporelle et pour tester rigoureusement les hypothèses sur leur diversification, leur écologie et leur dispersion.Les plantes à fleurs, les insectes et les grands animaux sont bien représentés dans les vastes collections (Krupnick & Kress, 2005 Mayer et al., 2013 Rocha et al., 2014 Steinicke, 2014 ). Dans de nombreux cas, ceux-ci ont également été numérisés au cours de la dernière décennie, fournissant des données d'occurrence durables et exactes accessibles au public (par exemple, GBIF, GBOL, JSTOR, Tropicos ® ). Des bases de données aussi puissantes et gérées en permanence sont rares pour les protistes, qui sont trop petits pour une observation directe et ont besoin d'une expertise microscopique pour l'examen. Cependant, le problème est reconnu et des efforts considérables ont été déployés pour créer des bases de données de séquences organisées et des arbres phylogénétiques de référence pour les dinophytes (Del Campo et al., 2018 Elferink et al., 2017 Mordret et al., 2018 Quast et al., 2013 ) et d'autres taxons microbiens.

Les taxons les plus fréquemment rencontrés correspondent à ceux connus des études morphologiques en Bavière, qui comprennent Apocalathium (Mauch et al., 2003 Mischke, Riedmüller, Hoehn, Deneke, & Nixdorf, 2015 Schaumburg, 1996 ), Cératium (Mauch et al., 2003 Raeder, 1990 Schaumburg, 1996 Schaumburg & Hehl, 2001 ), et péridinium (Fröbrich, Mangelsdorf, Schauer, Streil, & Wachter, 1977 Mauch et al., 2003 Mischke et al., 2015 Raeder, 1990 Schaumburg, 1996), totalisant près de 80% de toutes les OTU identifiées. Nos résultats basés sur des séquences semblent étayer nos propres confirmations morphologiques dans les échantillons que nous avons étudiés, et de telles approches combinatoires sont nécessaires (Medinger et al., 2010 Rimet, Vasselon, A-Keszte, & Bouchez, 2018 Mora et al., 2019 ), tant que l'obstacle taxonomique et l'incertitude liés à la détermination du taxon continueront d'exister. Cependant, lorsque l'on compare les évaluations de la diversité morphologique et génétique des espèces, il faut prendre en compte la variation morphologique et la spéciation cryptique. Sur un spectre plus large, ceux-ci pourraient notamment se corroborer ou se contredire en apparence. Ainsi, avoir une large connaissance de la biologie du microbiote étudié est d'une grande importance, comme pour l'exemple donné ci-dessous.

L'identification potentielle de quelques taxons marins dans le milieu d'eau douce basée sur des séquences est surprenante. La contamination due aux méthodes appliquées est très peu probable, car ces espèces ne sont pas cultivées dans nos laboratoires, mais l'évaluation incomplète des dinophytes d'eau douce dans les bases de données ADN de référence peut expliquer la détection ostensible de taxons marins dans nos échantillons. Cependant, certains dinophytes ont colonisé l'eau douce des habitats marins relativement récemment (Žerdoner Čalasan, Kretschmann, & Gottschling, 2019 ). De plus, différents taux d'évolution de l'opéron ARNr peuvent avoir un impact sur la position phylogénétique de certaines lectures. Par exemple, Gonyaulax clevei a été signalée dans les lacs allemands (Hickel & Pollhinger, 1986 ), mais n'a jamais été séquencée. Il est possible que ces séquences une fois acquises se regroupent avec des taxons marins tels que des espèces de Lingulodinium. De plus, quelques organismes sont physiologiquement capables de surmonter avec succès la barrière physiologique entre les océans et les habitats d'eau douce (Pokorný, 2009) et d'établir de nouvelles populations. En tant que modèles vivants, des espèces telles que Huia caspica et Kolkwitziella acuta pourrait être une clé à cet égard, car ils se trouvent à la fois dans les habitats marins et d'eau douce (Gu, Mertens et Liu, 2016 Mertens et al., 2015 ). Par tous les moyens, le rôle biologique précis et l'activité biologique globale doivent être déterminés pour les taxons marins dans les environnements d'eau douce. Les recherches futures devraient utiliser rigoureusement des spécimens physiques et de préférence des souches vivantes. De plus, la richesse en espèces de dinophytes dans les lacs bavarois peut être supérieure à celle précédemment rapportée dans la littérature sur la base de notre analyse génétique. En particulier, le nombre considérable de Pfiesteria-comme des séquences (Burkholder & Marshall, 2012 Calado, Craveiro, Daugbjerg, & Moestrup, 2009 Litaker et al., 2005) est impressionnant. Une recherche ciblée à l'avenir évaluera cette diversité et abordera des questions, telles que s'il s'agit d'espèces déjà acceptées sans informations sur la séquence d'ADN connues jusqu'à présent ou même de nouvelles espèces.

Dans le monde microbien, l'importance des séquences d'ADN liées au matériel type ne peut être surestimée. À cet égard, notre approche consistant à placer les OTU sur un arbre de référence à l'aide de représentants organisés et documentés s'est avérée fructueuse avec la documentation de séquences identiques à Biecheleria brevisulcata (Suessiacées), Palatinus apiculatus (Peridiniopsidacées), et Theleodinium calcisporum (Thoracosphaeraceae). La première et la dernière espèce ont été décrites il y a seulement quelques années (Craveiro et al., 2013 Takahashi, Sarai, & Iwataki, 2014 ), mais Palatinus apiculatus fait référence à un nom historique du 19 e siècle (Ehrenberg, 1838 ). Habituellement, ces noms ne sont pas liés à des informations sur les séquences d'ADN, mais l'application de l'épitypification a rendu la détermination de ces espèces sans ambiguïté (Kretschmann, Žerdoner Čalasan, Kusber, & Gottschling, 2018). Cette stratégie n'a pas, à notre connaissance, été appliquée pour les espèces de Cératium, ce qui rend vague la détermination des nombreuses OTU obtenues dans cette étude au niveau de l'espèce. Une fois identifiés, des clarifications taxonomiques stratégiques des organismes cibles sont possibles et peuvent faire référence à des noms tels que Ceratium macroceras et Ceratium tetraceros, tous deux décrits de Bavière (Schrank, 1793 , 1802 ). Cependant, comme la variabilité intraspécifique et interspécifique potentielle ainsi que la possible spéciation cryptique et la variabilité morphologique de Cératium sont actuellement inconnues, la clarification taxonomique doit être effectuée avec une grande prudence, en tenant compte de tous ces aspects. L'outil taxonomique d'épitypification fourni par le Code international de nomenclature des algues, des champignons et des plantes (Turland et al., 2018 ) n'est toujours pas régulièrement utilisé en phycologie, alors qu'il est d'une grande importance pour la taxonomie stable. De telles approches doivent être mises en œuvre, car le pouvoir de résolution de toutes les méthodes HTS disponibles, comme illustré dans cette étude, se résume toujours à la nécessité fondamentale d'une application fiable des noms.

Les bases de données de référence contemporaines organisées laissent encore plus de place pour des améliorations. Par exemple, un certain nombre de séquences OTU obtenues dans cette étude ont été attribuées à Scrippsiella par la référence SILVA (Quast et al., 2013), qui est une lignée de dinophytes à prédominance marine. De telles entrées le désignent de manière trompeuse comme "Scrippsiella" hangoei, qui est un nom classé aujourd'hui sous Apocalathium. Par conséquent, le nom d'espèce correct pour les OTU est (probablement) eau douce Apocalathium aciculiferum. Ce n'est peut-être qu'une question de temps avant que cette confusion taxonomique particulière ne soit corrigée pour les futures versions des bases de données SILVA, car cette erreur a déjà été corrigée dans la base de données dinoref (Mordret et al., 2018 ). Ce dernier, à son tour, repose uniquement sur les données de séquences de référence SSU et est donc incapable de placer les OTU environnementales d'études utilisant des séquences LSU (Elferink et al., 2017) et/ou ITS (Lutz, McCutcheon, McQuaid, & Benning, 2018 ) . Parallèlement, des taxons tels que péridinielle, Sphaerodinium et Tyrannodinium, dont seules les séquences LSU sont connues à l'heure actuelle, sont par la suite indétectables par dinoref (cependant, †Léonella et †Posoniella sont également manquants, bien que les séquences de référence SSU soient déjà disponibles). La variété des approches de séquençage nécessite donc une base de données qui assure à la fois la fourniture d'informations étendues sur les séquences d'ARNr et la fiabilité taxonomique. À cet égard, l'indication des séquences qui ont été obtenues à partir du matériel type est également importante (Pawlowski et al., 2012) et doit être ajoutée dans dinoref. De plus, la curation de la base de données dinoref n'a pas empêché l'utilisation de noms tels que « Goniodomataceae », qui ont été rejetés nomenclaturment (Elbrächter & Gottschling, 2015 Prud'homme Van Reine, 2017 ).

Notre approche pour détecter les dinophytes dans les lacs bavarois est puissante et jettera les bases d'informations solides sur les espèces largement distribuées et abondantes, et celles qui sont plus rares et représentent des entités plutôt endémiques avec des distributions plus étroites. Si les occurrences d'espèces de dinophytes sont en corrélation avec des traits environnementaux, alors des circonscriptions d'espèces améliorées tenant également compte de leur niche écologique sont possibles. Avec notre projet, nous pouvons commencer à comprendre non seulement cette une certaine espèce se trouve dans un habitat d'eau douce donné, mais aussi Pourquoi. Notre exemple de cartographie sur le terrain et la prévisibilité recherchée des occurrences de dinophytes d'eau douce ont donc un grand potentiel pour servir de modèle à d'autres groupes taxonomiques et/ou à l'étude d'environnements similaires et alternatifs dans d'autres parties du monde.


Pourquoi la requête PostGIS n'utilise-t-elle pas l'index spatial ? - Systèmes d'information géographique

IEICE - Transactions sur l'Information et les Systèmes
Journal Prestige (SJR) : 0.195
Impact des citations (citeScore) : 1
Nombre d'abonnés : 5

Journal d'abonnement
ISSN (imprimé) 0916-8532 - ISSN (en ligne) 1745-1361
Publié par Institut des ingénieurs en électronique, information et communication [4 revues]

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Aidez-nous à tester notre nouvelle fonction de recherche de pré-impression en attribuant une note au lien de pré-impression.
Une note de 5 étoiles indique que la pré-impression liée a exactement le même contenu que l'article publié.

Votre adresse IP : 85.113.129.232


Entrepôt de données en temps réel avec MemSQL sur Cisco UCS

Nous sommes à un point d'inflexion où nous nous dirigeons vers un monde où tout est connecté à tout le reste. C'est ce que signifie l'Internet des objets (IoT). L'IoT relie les objets à Internet, créant une économie toujours active en permettant des données et des informations jamais disponibles auparavant. Par définition, l'économie permanente nécessite des analyses en temps réel. Les capacités d'analyse devenant le principal différenciateur concurrentiel, les entreprises doivent désormais avoir la capacité d'analyser des téraoctets et des pétaoctets de données, à la fois en temps réel au fur et à mesure que les données sont générées, et pour la Business Intelligence en utilisant les données passées. De plus en plus, il est nécessaire de joindre des données historiques avec des données de streaming en temps réel, ce qui s'est avéré assez difficile à mesure que la taille des ensembles de données a augmenté.

Les solutions d'analyse ont été un élément clé de notre portefeuille d'ingénierie de solutions depuis le tout début, lorsque nous avons introduit Cisco UCS en 2009.Cela est vrai à la fois pour les systèmes relationnels traditionnels et pour les analyses de données massives émergentes (souvent décrites en utilisant les trois V : volume, variété et vitesse et parfois aussi avec les trois I : investissements, innovations et improvisation).

Aujourd'hui, je suis heureux d'annoncer un autre ajout à notre portefeuille croissant de solutions d'analyse : Cisco UCS avec MemSQL pour les applications d'entreposage de données en temps réel.

MemSQL est un système de gestion de base de données relationnelle distribué, en mémoire et entièrement conforme à SQL. Il peut ingérer et transformer des millions d'événements de données par jour tout en analysant simultanément des milliards de lignes de données à l'aide de SQL standard, comme le montre la figure ci-dessous.

Certaines des fonctionnalités clés de MemSQL incluent :

  • Ingestion rapide des données : collectez des données à l'aide de courtiers de messages courants tels qu'Apache Kafka tout en maintenant une livraison durable et cohérente avec une sémantique exacte
  • Analyse rapide : interrogez des téraoctets de données avec une compression de données avancée à l'aide de tables optimisées pour le disque avec une compression élevée et des requêtes vectorisées pour une analyse rapide
  • Analyse en temps réel : utilisez des tables à mémoire optimisée pour analyser les événements en temps réel
  • Prise en charge géospatiale : stockez, interrogez et indexez les types de données géographiques, y compris les polygones et les points, pour prendre en charge les analyses de zone, de distance et de localisation en temps réel
  • JSON optimisé : stockez et interrogez les données JSON en tant que type de colonne pour stocker et analyser efficacement les objets multi-attributs
  • Jointures entièrement distribuées : faites évoluer les jointures entièrement distribuées sur n'importe quelle table et colonne pour un accès simple et efficace aux requêtes.

L'infrastructure intégrée Cisco UCS pour le Big Data et l'analyse est une plate-forme idéale pour les déploiements MemSQL, capable de traiter de gros volumes de données en temps réel ou archivées, à la fois structurées et non structurées.

Comme le montre la figure ci-dessous, notre solution commune fournit une plate-forme d'entrepôt de données évolutive et en temps réel pour les applications hautes performances qui nécessitent des données rapides, précises, sécurisées et toujours disponibles, avec une évolutivité linéaire à des millions d'événements par seconde tout en analysant des pétaoctets de données pour des idées.

L'infrastructure intégrée Cisco UCS pour le Big Data et l'analyse avec MemSQL fournit une infrastructure simplifiée et intelligente et un entrepôt de données en temps réel avec l'évolutivité nécessaire pour répondre aux demandes croissantes des entreprises :

  • Combine les innovations de Cisco UCS telles que l'infrastructure programmable avec les capacités d'analyse en temps réel de MemSQL
  • Conçu et optimisé pour l'analyse en temps réel, l'Internet des objets, la personnalisation et les recommandations, la gestion des risques, la surveillance et la détection, et le client 360
  • Pré-testé, pré-validé et documenté par les ingénieurs Cisco et MemSQL pour garantir des déploiements fiables pouvant évoluer de petit à très grand en fonction des demandes de charge de travail pour les déploiements BDA d'entreprise grâce à l'évolutivité, aux performances, au délai de mise sur le marché et à la rentabilité (Source : IDC) .

L'architecture de référence commune est illustrée dans la figure ci-dessous. L'architecture peut évoluer en fonction des exigences de la charge de travail, y compris l'extension à des milliers de serveurs grâce à l'utilisation de commutateurs Cisco Nexus 9000.


DESCRIPTION DÉTAILLÉE DE L'INVENTION ILLUSTRÉE

On se référera maintenant en détail aux principes de la présente invention, dont des exemples sont illustrés dans les dessins annexés.

Dans un mode de réalisation de la présente invention, un système de traitement d'informations d'événements de traitement d'informations basées sur des événements pour distribution et affichage dans un système de traitement d'informations d'événements comprend une base de données et un logiciel associé pour acquérir, indexer, stocker et récupérer des informations basées sur des événements. Les informations basées sur l'événement peuvent être caractérisées par des attributs de sujet, d'heure et d'emplacement. Des moyens d'affichage peuvent être fournis qui sont capables d'afficher les informations basées sur l'événement. Les informations basées sur les événements peuvent être affichées sous forme d'informations sur les événements reflétant une requête dictée par des critères de recherche comprenant des plages coétendues de sujet, de temps et d'emplacement.

Le procédé comprend l'acquisition et l'organisation d'informations en associations thématiques, temporelles et de localisation, y compris l'application de règles sémantiques pour analyser des informations basées sur des événements textuels afin de développer au moins ces trois associations. Les informations peuvent être acquises et traitées en temps réel, à partir d'un flux différé ou à partir de sources archivées. Une interface utilisateur fournit un moyen de visualiser, de faire des références croisées, d'interroger et d'afficher des informations dans une ou plusieurs combinaisons des trois associations. Le procédé selon la présente invention peut être étendu pour inclure des sélections utilisateur prédéfinies de sujets, de plages de temps et d'emplacements spécifiés. Le procédé peut être invoqué par et distribué à des ordinateurs personnels dotés de systèmes d'affichage visuel, Internet, Intranet, courrier électronique, PDA et autres dispositifs sans fil ou câblés. Des informations supplémentaires, y compris des représentations illustrées, peuvent être ingérées, archivées et récupérées pour affichage ou distribution par l'une des trois associations.

[0054] Comme le montre généralement la Fig. 1, un mode de réalisation de la présente invention comprend un système de traitement d'informations d'événement 10 qui peut être un service accessible sur Internet qui fournit des informations d'événement aux utilisateurs 15 utilisant un procédé de traitement d'informations d'événement. En règle générale, un événement constitue quelque chose qui se produit, un événement remarquable, une occasion ou une activité sociale. Alternativement, un événement peut également être décrit comme étant l'entité fondamentale de la réalité physique observée représentée par un point désigné par trois coordonnées de lieu et une de temps dans le continuum espace-temps postulé par la théorie de la relativité, ou toute information qui contient des informations d'actualité. , les références temporelles et de localisation, avec ou sans données corrélées. Les informations d'événement peuvent être textuelles, numériques, graphiques ou autres qui peuvent être corrélées et organisées par des associations selon des attributs de sujet, d'heure et de lieu ou d'autres attributs et peuvent être visualisées sur la base d'une autorisation de visualisation d'événement d'utilisateurs. Les informations d'événements publics 20 peuvent être ingérées et organisées à partir de fournisseurs d'informations publiques dans une base de données d'événements 25 sur la base d'associations des trois attributs de sujet, d'heure et de lieu et de tout attribut supplémentaire et mises à disposition des utilisateurs publics 30 . Comme cela sera discuté plus en détail ci-dessous en référence à la Fig. 6, une interface utilisateur permet aux utilisateurs d'interroger, de faire des références croisées et d'afficher des informations d'événement dans une ou plusieurs associations des attributs tels qu'ils sont ingérés et organisés. Comme les utilisateurs publics, les utilisateurs enregistrés 55 peuvent visualiser des informations d'événement via l'interface utilisateur, mais peuvent également prédéfinir des préférences de visualisation d'événement comprenant des attributs de requête d'événement et des modes de distribution. Les utilisateurs enregistrés peuvent soumettre des informations basées sur des événements 24, par exemple des données contenant un sujet, une heure et un emplacement, dans la base de données d'événements pour distribution, désignant une distribution publique ou une distribution aux membres d'un groupe d'utilisateurs enregistrés 60 spécifié. Les informations d'événement d'affiliation 40 peuvent être entrées dans un réseau virtuel privé (PVN) 45 par un administrateur d'affiliation ou un autre fournisseur d'informations, organisées par attributs spécifiés, et publiées dans la base de données d'événements pour être distribuées à un groupe d'utilisateurs prédéterminés ou à des membres affiliés 50.

[0055] Comme le montre la Fig. 2, une description plus détaillée du processus esquissé sur la Fig. 1 sera maintenant discuté.

Pour ingérer et organiser des informations d'événements, les informations doivent d'abord être acquises à l'aide d'une logique d'acquisition 100 . L'acquisition de contenu auprès de fournisseurs d'informations tels que des sources d'information 110, par exemple, des organisations qui alimentent des informations basées sur des événements structurées dans un format journalistique, et d'autres sources d'événements 115 peut être accomplie grâce à l'utilisation de sources directes 120, d'une technologie de récolte 122, d'une entrée manuelle de données basées sur des événements. informations 124 , ou acquisition d' informations sur les événements par accès direct aux référentiels existants 126 . Par exemple, les alimentations directes comprennent des processus automatisés ayant des moyens pour ingérer des informations basées sur des événements formatés fournies par l'affilié dans une base de données d'événements sur la base de protocoles de communication établis et de formats définis. La récolte est un processus doté de moyens pour capturer automatiquement des informations basées sur des événements à partir d'une source connue et les ingérer dans une base de données d'événements.

En utilisant la logique TTL (Topical, Temporal, and Location) 200, des règles lexicales et sémantiques peuvent être utilisées pour analyser les informations textuelles acquises ou traiter d'autres formats 130 pour trouver les attributs de sujet 210, d'heure 220 et d'emplacement 230 des informations pour organiser , interrogation, référencement croisé, distribution et affichage. Les valeurs d'attribut pour chaque événement peuvent être déterminées à partir du contenu de l'événement, de la source et de corrélations supplémentaires, comme cela sera discuté plus en détail ci-dessous en référence à la Fig. 3 .

Une fois que les informations acquises 130 ont été analysées TTL, les informations 250 peuvent être formatées et stockées en tant qu'informations d'événement dans une base de données d'événements en utilisant la logique de base de données d'événements 300 . Les informations, indexées par des attributs de sujet, d'heure et d'emplacement, peuvent être stockées soit dans une base de données d'événements publics 320, soit dans une base de données d'événements privés 310, en fonction d'une autorisation de visualisation d'événements des informations basées sur les événements. La logique de la base de données d'événements vérifie quelles informations sont accessibles à quels types d'utilisateurs, par exemple, public, privé, groupe prédéfini, etc. De plus, la logique de base de données comprend des processus pour stocker, récupérer, archiver et protéger les informations d'événement comme cela sera expliqué dans plus en détail ci-dessous en référence à la fig. 4 .

Les informations d'événement sélectionnées dans la base de données d'événements 330 peuvent ensuite être augmentées en utilisant la logique de pré-présentation 400. Ce traitement de pré-présentation soumet les critères de recherche 430 à la logique de recherche 480 pour contrôler la récupération des informations d'événement à partir des bases de données d'événements, traite les attributs de sujet, d'heure et d'emplacement des informations récupérées à l'aide de la logique de données spatiales 460 et de la logique de référence auxiliaire 470 pour fournir informations complémentaires liées aux événements. En conséquence, les informations d'événement peuvent être traitées pour incorporer des informations auxiliaires correspondantes, par exemple, des cartes ou d'autres images spatiales provenant des sources de données spatiales 410, du texte, des graphiques, des informations multimédias, du matériel marketing tel que des logos ou des en-têtes provenant des sources de référence auxiliaires 420, des publicités basées sur des événements fournies par les sources publicitaires et gérées par la logique publicitaire (incorporée dans Ancillary Reference Logic 470 ), toutes reflétant les éléments d'attribut des critères de recherche 430 qui ont été définis manuellement ou en interne. Les données spatiales, les graphiques et les publicités peuvent être périodiquement mis à jour par le système de traitement d'informations d'événement à l'aide de divers composants de données spatiales, de graphiques et de logique publicitaire.

Les informations d'événement récupérées 440 comprenant au moins l'un des résultats des correspondances de critères de recherche d'attributs, ainsi que des informations descriptives auxiliaires et des données spatiales peuvent ensuite être sorties vers la logique de présentation/distribution 500 . La logique de présentation/distribution distribue les informations récupérées à un ou plusieurs utilisateurs prédéterminés dans un ou plusieurs formats prédéterminés sur la base des préférences de l'utilisateur public 510 ou de l'utilisateur privé 520. Les préférences, modes et autorisations de présentation des utilisateurs privés peuvent être définis individuellement par les utilisateurs enregistrés ou par les administrateurs affiliés pour leurs membres affiliés.

Les utilisateurs peuvent afficher des informations d'événement qui sont sélectionnées par sujet, heure et lieu. Les utilisateurs enregistrés peuvent prédéfinir des préférences qui identifient les informations d'événement pertinentes par sujet, heure et lieu. Les administrateurs affiliés et les utilisateurs enregistrés peuvent identifier comment les informations sur l'événement seront distribuées et sur quels appareils destinataires. Des « alertes d'événement » peuvent être créées et distribuées par les promoteurs d'événements aux utilisateurs en fonction des préférences de l'utilisateur et de la sélection de l'appareil destinataire, en utilisant la technologie push. Par conséquent, les promoteurs d'événements peuvent identifier des informations d'événement à distribuer à des utilisateurs ou à des groupes d'utilisateurs sur la base d'un sujet, d'une heure, d'un emplacement ou de règles commerciales tierces.

La diffusion des informations peut être prédéfinie dans les règles métier internes ou tierces. Les règles commerciales indiquent comment les informations sur l'événement peuvent être formatées et distribuées tout au long de la chaîne de valeur. Les règles commerciales contiennent une identification du type de dispositif d'affichage, par exemple un ordinateur, un dispositif sans fil, etc., sur lequel les informations doivent être présentées. En conséquence, la logique de présentation/distribution dans le système de traitement d'informations d'événement convertit ou traduit les informations pour la distribution.

Si les informations d'événement doivent être distribuées via l'interface utilisateur 600, les informations d'événement 530 peuvent être formatées pour l'affichage. L'interface utilisateur comprend une interface utilisateur graphique (GUI) et fournit tous les outils de navigation, de requête et de visualisation pour interagir avec les informations d'événement résidant dans la base de données d'événements, ainsi qu'un moyen pour les utilisateurs enregistrés d'entrer des données d'événement dans la base de données d'événements. . Un exemple d'une GUI accessible sur Internet sera discuté plus en détail en référence à la Fig. 6 .

En référence à la Fig. 3, une explication plus détaillée du processus d'analyse et d'indexation d'attributs dans la logique de localisation topique, temporelle (TTL) peut être la suivante. L'analyse d'informations basée sur des règles et lexicale peut être utilisée pour analyser les informations ingérées par attributs, par exemple, le sujet, l'heure et l'emplacement (attributs TTL) 260 pour organiser les informations d'événement. Au fur et à mesure que les informations 130 sont ingérées, chaque mot ou groupe de mots peut être analysé par un ensemble de règles métier et d'outils d'analyse lexicale. Les règles métier filtrent et indexent les informations sur les événements à partir des informations ingérées 130 . L'analyse TTL peut utiliser des règles commerciales de traitement d'informations d'événement internes 240 et des règles commerciales de tiers 242 pour organiser des informations d'événement. Des parties des règles internes de traitement des informations sur les événements peuvent être modifiées par des règles commerciales tierces pour déterminer comment les informations sur les événements fournies par une société affiliée peuvent être ingérées, classées, catégorisées, organisées, stockées, distribuées et présentées. Pour que la méthode de traitement des informations d'événement accepte les règles métier tierces, certaines informations doivent être fournies à la méthode de traitement des informations d'événement, y compris, par exemple, 1) le format des informations à ingérer 2) les règles métier tierces, par ex. , la distribution, la présentation, etc. de l'information sur l'événement, à appliquer et 3) les références pertinentes au sujet, à l'heure et au lieu, par exemple, des lexiques ou des ressources.

Le format d'ingestion permet au procédé de traitement d'informations d'événement d'analyser efficacement les informations ingérées. Dans les cas impliquant des informations collectées ou des flux directs provenant de sociétés affiliées tierces, par exemple, des sources d'information telles que AP et Reuters, le format d'acquisition peut être XML. Cependant, d'autres formats d'acquisition tels que HTML, texte brut, texte délimité par des caractères et accès direct aux champs de la base de données peuvent également être utilisés. L'entrée manuelle d'informations d'événement peut être soumise par des utilisateurs enregistrés dans, par exemple, un format HTML en utilisant un formulaire de soumission fourni par le système de traitement d'informations d'événement. Les en-têtes et les balises de données peuvent être analysés comme un filtre initial des informations. A partir des en-têtes et des balises de données, des mots-clés peuvent être discernés pour valider la source de l'information et créer des catégories générales de référencement et d'indexation. Les règles commerciales internes 240 peuvent ensuite être appliquées pour segmenter davantage les informations en catégories plus spécifiques. Une fois que les en-têtes et les balises de données ont été traités, le corps du contenu peut être adressé.

Un exemple d'un ensemble de règles commerciales internes 240 à appliquer aux informations basées sur les événements à ingérer dans la base de données d'événements peut être le suivant : 1) Identifier/valider la source d'informations et le format des informations 2) Analyser les en-têtes d'informations et les balises de données en utilisant des formats de données connus 3) Analyser les en-têtes et les balises de données pour les références de sujet, d'heure et de lieu 4) Appliquer une recherche par mot thématique en faisant des références croisées à une référence de catégorie thématique et à un dictionnaire dans Lexicon/Reference Source 244 (voir ci-dessous) 5) Indexer les mots thématiques par hiérarchie de référence de catégorie thématique dans Lexicon/Reference Source 244 (voir ci-dessous) 6) Appliquer le traitement heure/date, par exemple, Année/Mois/Jour et/ou Heure/Minute/Seconde, en croisant la référence de catégorie heure/date dans Lexicon /Source de référence 244 (voir ci-dessous) 7) Indexer l'heure/la date avec le temps moyen de Greenwich et/ou par hiérarchie dans la référence de catégorie de temps dans Lexicon/Source de référence 244 (voir ci-dessous) 8) Appliquer la recherche de localisation des noms propres géographiques et de l'adresse es en croisant les noms propres géographiques avec un index géographique ou des adresses de géocodage dans le Lexique/Source de référence 244 (voir ci-dessous) 10) Indexer les emplacements géographiques par longitude/latitude et/ou par hiérarchie au sein de la référence de catégorie d'emplacement dans Lexique/Source de référence 244 ( voir ci-dessous) pour la récupération de données spatiales et 11) Créer une extension de lien hypertexte géographique (GHE), comme nous le verrons plus en détail ci-dessous.

Au cours de l'étape 242, d'éventuelles règles métier tierces peuvent être appliquées aux informations d'événement soumises au moyen des flux directs. En conséquence, des attributs topiques, temporels, de localisation et supplémentaires peuvent être déterminés par les règles commerciales du tiers.

Selon la présente invention, la technique d'analyse syntaxique utilisée à l'étape 240 comprend un système de reconnaissance de contexte géographique contenant un solveur de noms propres géographiques qui traite des noms géographiques à l'aide de diverses techniques, notamment, par exemple :

1. Recherche de toute lettre en majuscule immédiatement après un espace blanc ou un signe de ponctuation. Traiter la lettre en majuscule comme la première lettre au début d'un nom propre, car les premières lettres de tous les noms propres géographiques sont en majuscule en anglais.

2. Collecter toutes les lettres jusqu'au prochain espace blanc ou ponctuation, en commençant par la première lettre du nom propre. Déterminer si les lettres collectées font partie d'un nom propre géographique et vérifier le nom propre dans un répertoire géographique pour trouver la latitude/longitude du nom propre, par exemple, « Rochester », « Rochester. », etc. En conséquence, le répertoire géographique comprend un dictionnaire des noms propres géographiques et de leur emplacement ou zone géographique associée, par exemple, une zone délimitée par une plage spécifiée de latitude et de longitude, ou contenue dans des cellules de carte contiguës spécifiées.

3. Reconnaître qu'un nom propre peut également être un mot tout en majuscules, par exemple NASA, passer à l'espace blanc/à la ponctuation suivants.

4. Déterminer si toutes les lettres dans le nom propre sont en majuscule et, si elles le sont, les filtrer contre une bibliothèque d'acronymes et l'éliminer si elle est trouvée, par exemple, PTA.

5. Déterminer si le nom propre est en majuscule et se termine par un espace blanc et rechercher la première lettre après l'espace blanc. Déterminer si la première lettre après l'espace blanc est en minuscule et, si c'est le cas, la considérer comme la fin du nom propre, par exemple, "Rochester est".

6. Déterminer si la lettre après l'espace blanc est en majuscule et prendre le(s) mot(s) entier(s) suivant(s) comme faisant partie du nom, par exemple, l'aéroport de La Guardia. De tels noms sont appelés noms à particule.

[0075] 7.Déterminer si la ponctuation immédiatement après le nom/nom verbal est une virgule, puis prendre ce mot et vérifier si le mot/la phrase suivante est un état (par exemple, « Rochester, NY » ou « New York, NY »), et trouver son l'emplacement à l'aide du répertoire géographique, une ressource mettant en corrélation les noms propres géographiques avec les emplacements.

Selon un mode de réalisation de l'invention, le répertoire géographique peut être étendu en comptabilisant et rapportant, par fréquence, les noms propres géographiques qui ne sont pas présents dans le répertoire géographique. Ce faisant, les noms propres géographiques manquants et leurs emplacements géographiques correspondants peuvent être entrés dans le répertoire géographique, classés par ordre de priorité par la fréquence d'occurrences de noms propres géographiques manquants.