Meilisearch 收集用户的匿名数据以改进我们的产品。这可以随时停用,并且已经收集的任何数据都可以按要求删除

我们使用哪些工具来收集和可视化数据?

我们使用数据收集和管理平台 Segment 来收集使用数据。然后,我们将这些数据输入到用于绘制图表和突出显示数据的工具 Amplitude 中,以便我们可以根据需要构建可视化。

我们收集哪些类型的数据?

我们的数据收集主要集中在以下类别
  • 系统指标,例如运行 Meilisearch 的设备的技术规格、软件版本和操作系统
  • 性能指标,例如搜索请求的成功率和平均延迟
  • 使用情况指标,旨在评估我们的最新功能。这些功能会随着每个新版本而变化
请参阅下方,了解我们目前收集的完整指标列表 我们绝不会:
  • 识别或追踪用户
  • 收集个人信息,例如 IP 地址、电子邮件地址或网站 URL
  • 存储添加到 Meilisearch 实例的文档中的数据

为什么要收集遥测数据?

我们收集遥测数据仅有两个原因:为了改进我们的产品,以及为了能够全职从事这个项目。 为了创建更好的产品,我们需要可靠的定量信息。我们收集的数据有助于我们修复错误、评估功能的成功与否,并更好地了解用户的需求。 我们还需要证明人们确实在使用 Meilisearch。使用情况指标有助于我们向投资者证明我们的存在,以便我们能够保持这个项目的生命力。

您为什么要相信我们?

不要相信我们——而是要追究我们的责任。 我们认为,当涉及到您的私人数据时,不信任科技公司是可以理解的,甚至是明智的。这就是为什么我们试图对数据收集保持完全透明,提供退出选项,并允许用户随时请求删除所有已收集的数据。在没有全球数据保护法律的情况下,我们认为这是处理数据收集的唯一道德方式。 没有公司是完美的。如果您觉得我们有任何不完全透明或收集侵犯您个人隐私的数据的行为,请通过发送电子邮件至我们的专用邮箱告知我们:[email protected]。同样,如果您发现任何与我们相关的数据权利倡议或数据保护工具,请分享给我们。我们对此主题充满热情并非常重视。

如何禁用数据收集

可以通过设置命令行选项或环境变量,然后重新启动 Meilisearch 实例来随时禁用数据收集。
meilisearch --no-analytics
有关配置 Meilisearch 的更多信息,请阅读我们的配置参考

如何删除所有收集的数据

我们 Meilisearch 团队提供一个电子邮件地址,以便用户可以请求从我们所有工具中完全删除他们的数据。 为此,请发送电子邮件至 [email protected],其中包含为您的 Meilisearch 安装生成的唯一标识符(启动 Meilisearch 时的Instance UID)。任何有关我们收集的数据管理问题也可以发送到此电子邮件地址。

所有收集数据的详尽列表

每当触发收集数据项的事件时,Meilisearch 不会立即发送。相反,它将其与批次中的其他数据捆绑在一起,最多为 500kb。批次每小时发送一次,或者达到 500kb 后发送,以先发生者为准。这样做是为了提高性能并减少网络流量。
此列表可能会随着 Meilisearch 的每个新版本而更改。这不是因为我们试图耍花招!而是因为当我们添加新功能时,我们需要收集更多数据点以查看它们的性能。
指标名称描述示例
context.app.versionMeilisearch 版本号1.3.0
infos.env--env/MEILI_ENV 的值生产
infos.db_path如果指定了 --db-path/MEILI_DB_PATH,则为 true
infos.import_dump如果指定了 --import-dump,则为 true
infos.dump_dir如果指定了 --dump-dir/MEILI_DUMP_DIR,则为 true
infos.ignore_missing_dump如果激活了 --ignore-missing-dump,则为 true
infos.ignore_dump_if_db_exists如果激活了 --ignore-dump-if-db-exists,则为 true
infos.import_snapshot如果指定了 --import-snapshot,则为 true
infos.schedule_snapshot如果设置了 --schedule_snapshot/MEILI_SCHEDULE_SNAPSHOT,则为该值,否则为 None86400
infos.snapshot_dir如果指定了 --snapshot-dir/MEILI_SNAPSHOT_DIR,则为 true
infos.ignore_missing_snapshot如果激活了 --ignore-missing-snapshot,则为 true
infos.ignore_snapshot_if_db_exists如果激活了 --ignore-snapshot-if-db-exists,则为 true
infos.http_addr如果指定了 --http-addr/MEILI_HTTP_ADDR,则为 true
infos.http_payload_size_limit--http-payload-size-limit/MEILI_HTTP_PAYLOAD_SIZE_LIMIT 的值,以字节为单位336042103
infos.log_level--log-level/MEILI_LOG_LEVEL 的值调试
infos.max_indexing_memory--max-indexing-memory/MEILI_MAX_INDEXING_MEMORY 的值,以字节为单位336042103
infos.max_indexing_threads--max-indexing-threads/MEILI_MAX_INDEXING_THREADS 的整数值4
infos.log_level--log-level/MEILI_LOG_LEVEL 的值调试
infos.ssl_auth_path如果指定了 --ssl-auth-path/MEILI_SSL_AUTH_PATH,则为 true
infos.ssl_cert_path如果指定了 --ssl-cert-path/MEILI_SSL_CERT_PATH,则为 true
infos.ssl_key_path如果指定了 --ssl-key-path/MEILI_SSL_KEY_PATH,则为 true
infos.ssl_ocsp_path如果指定了 --ssl-ocsp-path/MEILI_SSL_OCSP_PATH,则为 true
infos.ssl_require_auth--ssl-require-auth/MEILI_SSL_REQUIRE_AUTH 的布尔值
infos.ssl_resumption如果指定了 --ssl-resumption/MEILI_SSL_RESUMPTION,则为 true
infos.ssl_tickets如果指定了 --ssl-tickets/MEILI_SSL_TICKETS,则为 true
system.distributionMeilisearch 启动时的发行版Arch Linux
system.kernel_versionMeilisearch 启动时的内核版本5.14.10
system.cores核心数24
system.ram_size总 RAM 容量。以 KB 表示16777216
system.disk_size最大磁盘的总容量。以 Bytes 表示1048576000
system.server_providerMEILI_SERVER_PROVIDER 环境变量的值AWS
stats.database_size数据库大小。以 Bytes 表示2621440
stats.indexes_number索引数量2
start_since_days实例启动以来的天数365
user_agentAPI 调用期间遇到的用户代理头[“Meilisearch Ruby (2.1)”, “Ruby (3.0)“]
requests.99th_response_time成功搜索请求中,最快 99% 的请求中最高的延迟57ms
requests.total_succeeded成功请求总数3456
requests.total_failed失败请求总数24
requests.total_received收到的搜索请求总数3480
requests.total_degraded达到搜索时间截止后取消的搜索总数100
requests.total_used_negative_operator计算使用负词或负短语运算符的搜索173
sort.with_geoPoint如果指定了排序规则 _geoPoint,则为 true
sort.avg_criteria_number所有包含 sort 参数的搜索请求中,平均排序条件数量2
filter.with_geoBoundingBox如果指定了筛选规则 _geoBoundingBox,则为 true
filter.with_geoRadius如果指定了筛选规则 _geoRadius,则为 true
filter.most_used_syntax所有包含 filter 参数的搜索请求中最常用的筛选语法字符串
q.max_terms_numberq 参数给定的最高词条数5
pagination.max_limitlimit 参数给定的最高值60
pagination.max_offsetoffset 参数给定的最高值1000
formatting.max_attributes_to_retrieve要检索的最大属性数100
formatting.max_attributes_to_highlight要高亮显示的最大属性数100
formatting.highlight_pre_tag如果指定了 highlightPreTag,则为 true
formatting.highlight_post_tag如果指定了 highlightPostTag,则为 true
formatting.max_attributes_to_crop要裁剪的最大属性数100
formatting.crop_length如果指定了 cropLength,则为 true
formatting.crop_marker如果指定了 cropMarker,则为 true
formatting.show_matches_position如果此批次中使用了 showMatchesPosition,则为 true
facets.avg_facets_number平均方面数10
primary_key明确设置主键时的名称。否则为 nullid
payload_typeContent-Type 标头中遇到的所有值,包括无效值[“application/json”, “text/plain”, “application/x-ndjson”]
index_creation如果文档添加或更新请求触发了索引创建,则为 true
ranking_rules.words_positionwords 排名规则的位置(如果有),否则为 null1
ranking_rules.typo_positiontypo 排名规则的位置(如果有),否则为 null2
ranking_rules.proximity_positionproximity 排名规则的位置(如果有),否则为 null3
ranking_rules.attribute_positionattribute 排名规则的位置(如果有),否则为 null4
ranking_rules.sort_positionsort 排名规则的位置5
ranking_rules.exactness_positionexactness 排名规则的位置(如果有),否则为 null6
ranking_rules.values一个表示不包含自定义升序-降序规则的排名规则的字符串“words, typo, attribute, sort, exactness”
sortable_attributes.total可排序属性的数量3
sortable_attributes.has_geo如果 _geo 设置为可排序属性,则为 true
filterable_attributes.total可过滤属性的数量3
filterable_attributes.has_geo如果 _geo 设置为可过滤属性,则为 true
filterable_attributes.has_patterns如果 filterableAttributes 使用 attributePatterns,则为 true
searchable_attributes.total可搜索属性的数量4
searchable_attributes.with_wildcard如果 * 指定为可搜索属性,则为 true
per_task_uid如果使用 uids 来获取特定任务资源,则为 true
filtered_by_uid如果任务按 uids 查询参数过滤,则为 true
filtered_by_index_uid如果任务按 indexUids 查询参数过滤,则为 true
filtered_by_type如果任务按 types 查询参数过滤,则为 true
filtered_by_status如果任务按 statuses 查询参数过滤,则为 true
filtered_by_canceled_by如果任务按 canceledBy 查询参数过滤,则为 true
filtered_by_before_enqueued_at如果任务按 beforeEnqueuedAt 查询参数过滤,则为 true
filtered_by_after_enqueued_at如果任务按 afterEnqueuedAt 查询参数过滤,则为 true
filtered_by_before_started_at如果任务按 beforeStartedAt 查询参数过滤,则为 true
filtered_by_after_started_at如果任务按 afterStartedAt 查询参数过滤,则为 true
filtered_by_before_finished_at如果任务按 beforeFinishedAt 查询参数过滤,则为 true
filtered_by_after_finished_at如果任务按 afterFinishedAt 查询参数过滤,则为 true
typo_tolerance.enabled如果启用了拼写容错,则为 true
typo_tolerance.disable_on_attributes如果为 disableOnAttributes 定义了至少一个值,则为 true
typo_tolerance.disable_on_words如果为 disableOnWords 定义了至少一个值,则为 true
typo_tolerance.min_word_size_for_typos.one_typominWordSizeForTypos.oneTypo 参数的定义值5
typo_tolerance.min_word_size_for_typos.two_typosminWordSizeForTypos.twoTypos 参数的定义值9
pagination.max_total_hitspagination.maxTotalHits 属性的定义值1000
faceting.max_values_per_facetfaceting.maxValuesPerFacet 属性的定义值100
distinct_attribute.set如果指定了字段名,则为 true
distinct如果聚合请求列表中指定了去重,则为 true
proximity_precision.set如果已手动设置此设置,则为 true
proximity_precision.valuebyWordbyAttributebyWord
facet_search.setfacetSearch 已被用户更改
facet_search.value用户设置的 facetSearch
prefix_search.setprefixSearch 已被用户更改
prefix_search.value用户设置的 prefixSearchindexingTime
displayed_attributes.total显示属性的数量3
displayed_attributes.with_wildcard如果 * 指定为显示属性,则为 true
stop_words.total停用词的数量3
separator_tokens.total分隔符标记的数量3
non_separator_tokens.total非分隔符标记的数量3
dictionary.total字典中的单词数量3
synonyms.total同义词的数量3
per_index_uid如果 uid 用于获取索引统计资源,则为 true
searches.avg_search_count聚合事件中每次调用接收到的搜索查询的平均数量4.2
searches.total_search_count聚合事件接收到的搜索查询总数16023
indexes.avg_distinct_index_count聚合事件中每次调用查询的平均不同索引数1.2
indexes.total_distinct_index_count聚合事件中不同索引查询的总数6023
indexes.total_single_index仅查询一个索引时的调用总数2007
matching_strategy.most_used_strategy最常用的词匹配策略last(最后)
infos.with_configuration_file如果实例是使用配置文件启动的,则为 true
infos.experimental_composite_embedders如果此实例的 compositeEmbedders 功能设置为 true,则为 true
infos.experimental_contains_filter如果启用了 containsFilter 实验功能,则为 true
infos.experimental_edit_documents_by_function如果启用了 editDocumentsByFunction 实验功能,则为 true
infos.experimental_enable_metrics如果启动时指定了 --experimental-enable-metrics,则为 true
infos.experimental_embedding_cache_entries配置的嵌入缓存大小100
infos.experimental_multimodal当启用多模态搜索功能时为 true
infos.experimental_no_edition_2024_for_settings如果实例禁用了新的索引器,则为 true
infos.experimental_replication_parameters如果启动时指定了 --experimental-replication-parameters,则为 true
infos.experimental_reduce_indexing_memory_usage如果启动时指定了 --experimental-reduce-indexing-memory-usage,则为 true
infos.experimental_logs_mode根据指定的值,可以是 humanjson人类
infos.experimental_enable_logs_route如果启动时指定了 --experimental-enable-logs-route,则为 true
infos.gpu_enabled如果 Meilisearch 是使用 CUDA 支持编译的,则为 true
swap_operation_number交换操作次数2
pagination.most_used_navigation最常用的搜索结果导航估计
per_document_id如果使用了 DELETE /indexes/:indexUid/documents/:documentUid 端点,则为 true
per_filter如果使用了 POST /indexes/:indexUid/documents/fetchGET /indexes/:indexUid/documents/POST /indexes/:indexUid/documents/delete 端点,则为 true
clear_all如果使用了 DELETE /indexes/:indexUid/documents 端点,则为 true
per_batch如果使用了 POST /indexes/:indexUid/documents/delete-batch 端点,则为 true
facets.total_distinct_facet_count聚合事件中查询的不同方面总数
facets.additional_search_parameters_provided如果为聚合事件提供了额外的搜索参数,则为 true
faceting.sort_facet_values_by_star_count如果所有字段都设置为按计数排序,则为 true
faceting.sort_facet_values_by_total设置的不同值的数量10
scoring.show_ranking_score如果聚合事件中使用了 showRankingScore,则为 true
scoring.show_ranking_score_details如果聚合事件中使用了 showRankingScoreDetails,则为 true
scoring.ranking_score_threshold如果聚合请求列表中指定了 rankingScoreThreshold,则为 true
attributes_to_search_on.total_number_of_uses设置 attributesToSearchOn 的查询总数5
vector.max_vector_size此批次中为 vector 参数给定的最高维度数1536
vector.retrieve_vectors如果此批次中使用了 retrieve_vectors 参数,则为 true
hybrid.enabled如果聚合事件中使用了混合搜索,则为 true
hybrid.semantic_ratio如果此批次中使用了 semanticRatio,则为 true,否则为 false
hybrid.total_mediamedia 不为 null 的搜索请求的聚合数量42
embedders.total定义的嵌入器的数量2
embedders.sources一个表示不同提供来源的数组[“huggingFace”, “userProvided”]
embedders.document_template_used一个布尔值,表示所提供的嵌入器中是否有一个定义了自定义模板
embedders.document_template_max_bytes一个表示所有嵌入器中 documentTemplateMaxBytes 最大值的值400
embedders.binary_quantization_used如果用户更新了嵌入设置的二进制量化字段,则为 true
infos.task_queue_webhook如果实例是使用任务队列 webhook 启动的,则为 true
infos.experimental_search_queue_size搜索队列的大小750
infos.experimental_dumpless_upgrade如果实例是使用该参数启动的,则为 true
locales用于 /search/settings 路由的区域设置列表[“fra”, “eng”]
federation.use_federation当至少一个多重搜索请求包含顶级联合对象时,为 true
network_has_self如果网络对象具有非空自字段,则为 true
network_size声明的远程数量0
network当网络实验功能启用时,为 true
experimental_network当网络实验功能启用时,为 true
remotes.total_distinct_remote_count聚合中每个搜索请求中出现的不同远程数量的总和48
remotes.avg_distinct_remote_count聚合中搜索请求中出现的不同远程的平均数量2.33
multimodal通过 /experimental-features 路由启用多模态搜索时为 true
export.total_received此批次中收到的导出数量152
export.has_api_key设置了 API 密钥的导出数量89
export.avg_index_patterns每个导出设置的平均索引模式数量3.2
export.avg_patterns_with_filter每个导出中带过滤器的索引模式的平均数量1.7
export.avg_payload_size每次导出的平均有效载荷大小512
webhooks_created实例中创建的 Webhook 数量2
webhooks.updated实例中所有 Webhook 更新的次数5
© . This site is unofficial and not affiliated with Meilisearch.