本文详细介绍了如何在php中通过cURL发送GET请求获取远程JSON数据,并利用递归函数对该数据进行深度清理。清理规则包括移除值为“N/A”、“- ”或空字符串的键值对,以及从嵌套数组中移除这些特定项,最终输出一个结构清晰、数据有效的json对象。
1. 获取远程JSON数据
在php中,我们通常使用curl库来发送http请求。以下代码演示了如何向指定url发起get请求并获取json响应:
<?php // 初始化cURL会话 $ch = curl_init('https://coderbyte.com/api/challenges/json/json-cleaning'); // 设置cURL选项 // CURLOPT_RETURNTRANSFER: 将curl_exec()获取的信息以字符串返回,而不是直接输出 curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); // CURLOPT_HEADER: 不输出响应头 curl_setopt($ch, CURLOPT_HEADER, 0); // 执行cURL请求并获取响应数据 $data = curl_exec($ch); // 关闭cURL会话 curl_close($ch); // 将JSON字符串解码为PHP数组 $newData = json_decode($data, true); // 打印原始解码后的数据(用于调试) // print_r($newData); ?>
这段代码首先初始化一个cURL句柄,然后配置它以返回响应内容而不输出响应头。curl_exec执行请求,并将返回的JSON字符串存储在$data变量中。最后,json_decode($data, true)将JSON字符串转换为一个关联数组,方便后续处理。
2. 定义JSON数据清理规则
我们的目标是清理一个可能包含多层嵌套的JSON对象。清理规则如下:
- 如果一个键的值是“N/A”、“- ”或空字符串,则移除该键值对。
- 如果这些特定值出现在一个数组中,则只移除数组中的该项,而不移除整个数组。
为了高效处理任意深度的嵌套结构,递归函数是最佳选择。
3. 实现递归清理函数
下面是一个实现上述清理逻辑的递归函数clean_obj:
立即学习“PHP免费学习笔记(深入)”;
<?php /** * 递归清理PHP数组(对应JSON对象)中的特定值。 * 移除值为 'N/A', '-', 或空字符串的元素。 * * @param Array $data 待清理的数组。 * @return array 清理后的数组。 */ function clean_obj(array $data): array { foreach ($data as $key => $val) { // 检查当前值是否为需要移除的特定字符串 if (is_string($val) && ($val === 'N/A' || $val === '-' || $val === '')) { unset($data[$key]); // 移除该键值对 } // 如果当前值是一个数组,则递归调用自身进行清理 else if (is_array($val)) { $data[$key] = clean_obj($val); // 将清理后的子数组赋值回原位置 // 如果子数组清理后变为空,也可以选择移除该空数组,视具体需求而定 // if (empty($data[$key])) { // unset($data[$key]); // } } } return $data; // 返回清理后的数组 } ?>
函数详解:
- clean_obj(array $data): array: 函数接受一个数组作为参数,并期望返回一个数组。
- foreach ($data as $key => $val): 遍历当前数组的所有键值对。
- if (is_string($val) && ($val === ‘N/A’ || $val === ‘-‘ || $val === ”)): 检查当前值是否为字符串,并且其内容是否为“N/A”、“- ”或空字符串。
- unset($data[$key]): 如果满足清理条件,则使用unset函数从数组中移除该键值对。
- else if (is_array($val)): 如果当前值是一个数组,这意味着我们遇到了一个嵌套结构。
- $data[$key] = clean_obj($val): 在这种情况下,我们递归调用clean_obj函数处理这个子数组,并将清理后的结果重新赋值给原始数组的对应键。
- return $data: 遍历完成后,返回清理过的数组。
4. 整合与执行
将获取数据的cURL部分与清理函数结合起来,即可完成整个流程:
<?php // ... (前面获取JSON数据和定义clean_obj函数的代码) ... // 初始化cURL会话 $ch = curl_init('https://coderbyte.com/api/challenges/json/json-cleaning'); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); curl_setopt($ch, CURLOPT_HEADER, 0); $data = curl_exec($ch); curl_close($ch); // 将JSON字符串解码为PHP数组 $newData = json_decode($data, true); // 调用清理函数处理数据 $cleanedArray = clean_obj($newData); // 打印清理后的数据 echo "<pre>" . print_r($cleanedArray, true) . "</pre>"; ?>
这段代码首先获取并解码JSON数据,然后将解码后的PHP数组传递给clean_obj函数进行清理。最后,使用print_r以可读格式输出清理后的数组。<pre>标签有助于在浏览器中保持输出的格式。
5. 注意事项与优化
- 错误处理:
- cURL错误: 在curl_exec之后,应检查curl_errno()和curl_error()来处理网络请求失败的情况。
- JSON解码错误: json_decode在解析失败时会返回NULL。应检查json_last_error()和json_last_error_msg()来处理无效JSON字符串。
- 性能: 对于非常大或深度极深的JSON结构,递归可能会导致栈溢出或性能问题。在这种极端情况下,可以考虑使用迭代方式(例如,基于栈的深度优先遍历)来避免递归深度限制。
- 数据类型检查: 当前的清理逻辑只针对字符串值。如果需要移除特定数值(如0)或布尔值(如false),则需要扩展clean_obj函数中的条件判断。
- 空数组/对象处理: 当前逻辑会保留清理后可能变为空的子数组。如果希望移除所有空数组或空对象,可以在递归返回后添加一个检查。
总结
通过结合cURL进行网络请求和递归函数处理嵌套数据结构,我们可以有效地从远程API获取JSON数据并根据特定规则进行深度清理。这种方法不仅能够处理简单的键值对,也能优雅地管理复杂的多层嵌套数据,确保最终得到的数据是干净、有效的。在实际应用中,务必加入健壮的错误处理机制,以应对各种潜在问题。
评论(已关闭)
评论已关闭